更新 EJQTDE_spider/ejqtde_main.py
This commit is contained in:
parent
07c334a903
commit
c1e1e59e05
@ -15,10 +15,10 @@ from urllib.parse import urljoin
|
|||||||
爬取网站:'https://www.math.u-szeged.hu/ejqtde'
|
爬取网站:'https://www.math.u-szeged.hu/ejqtde'
|
||||||
|
|
||||||
==========运行顺序==========
|
==========运行顺序==========
|
||||||
1、ejqtde_main 获取各年份的期刊链接
|
1、ejqtde_main 获取各年份的期刊链接
|
||||||
2、ejqtde_scrawler 抓取各篇论文的信息和作者信息 -> 调用ejqtde_save -> 存入小文件(json)暂存
|
2、ejqtde_scrawler 抓取各篇论文的信息和作者信息 -> 调用ejqtde_save -> 存入小文件(json)暂存
|
||||||
3、ejqtde_save 从本地浏览暂存的小文件筛选后存入不同年份的大文件
|
3、ejqtde_save 从本地浏览暂存的小文件筛选后存入不同年份的大文件
|
||||||
*4、ejqtde_save.delete()(可选) 删除暂存区内部所有文件(注意备份)
|
*4、ejqtde_save.delete()(可选) 删除暂存区内部所有文件(注意备份)
|
||||||
'''
|
'''
|
||||||
|
|
||||||
|
|
||||||
|
|||||||
Loading…
x
Reference in New Issue
Block a user