From c1e1e59e052f5ef4d5f059873400f9b66323a43a Mon Sep 17 00:00:00 2001 From: XCX Date: Thu, 27 Jul 2023 10:30:26 +0800 Subject: [PATCH] =?UTF-8?q?=E6=9B=B4=E6=96=B0=20EJQTDE=5Fspider/ejqtde=5Fm?= =?UTF-8?q?ain.py?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- EJQTDE_spider/ejqtde_main.py | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/EJQTDE_spider/ejqtde_main.py b/EJQTDE_spider/ejqtde_main.py index 1a045ff..4917e6c 100644 --- a/EJQTDE_spider/ejqtde_main.py +++ b/EJQTDE_spider/ejqtde_main.py @@ -15,10 +15,10 @@ from urllib.parse import urljoin 爬取网站:'https://www.math.u-szeged.hu/ejqtde' ==========运行顺序========== - 1、ejqtde_main 获取各年份的期刊链接 - 2、ejqtde_scrawler 抓取各篇论文的信息和作者信息 -> 调用ejqtde_save -> 存入小文件(json)暂存 - 3、ejqtde_save 从本地浏览暂存的小文件筛选后存入不同年份的大文件 - *4、ejqtde_save.delete()(可选) 删除暂存区内部所有文件(注意备份) + 1、ejqtde_main 获取各年份的期刊链接 + 2、ejqtde_scrawler 抓取各篇论文的信息和作者信息 -> 调用ejqtde_save -> 存入小文件(json)暂存 + 3、ejqtde_save 从本地浏览暂存的小文件筛选后存入不同年份的大文件 + *4、ejqtde_save.delete()(可选) 删除暂存区内部所有文件(注意备份) '''