缘由

QDUOJ的开发以及众多OJ的题库，使得我们自动化添加题目更加轻松。前提是您需要获得各OJ的测试数据。

数据（某OJ数据&已经解压完成的）

1000-1999数据链接：https://pan.baidu.com/s/1SvCgulQt8rn8m7w0cbMExQ 密码：jg7m

概况

目前主要模块分为

爬虫部分-WebSpider
自动化加题部分-AddProblem

因为懒得解析markdown文档，所有用了爬虫scrapy,并且爬虫获取到的数据相对而言文档更容易解析与添加。如果您能够通过pandoc转文件后，将文本提取出来也可以。

需要安装的软件

Python
MongoDB(V3.4)
MongoDB 客户端工具-推荐使用RoBo 3T

准备

解压获取已准备好的BZOJ

你需要将BZOJ目录下的压缩文件解压，解压至你的web服务器目录下。

安装scrapy

具体安装文档请见docs。

启动爬虫并检查数据库是否存在数据

修改爬虫配置并执行爬虫:

url在bzoj.py
MongoDB数据配置在settings.py

执行爬虫：scrapy crawl bzoj

解压与重新压缩数据

你需要修改文件路径与压缩路径：

路径设置在pack_sample.py。 start_dir = "E:\Problem\Testcase\no" # 需要遍历的目录 zip_dir = "E:\Problem\Testcase\ok" # 解压后的目录

你需要执行以下命令：

python pack_sample.py 
# 如果您懂python程序设计，可以写多线程解压缩。

图片位置

在本项目中已经提供BZOJ，所以您可以直接在BZOJ解压包中看到JudgeOnline找到upload以及images两个图片目录，你只需要将这个两个目录复制到已经部署好的qduoj的 public目录下。

安装自动加题所需要的库

webdriver
selenium
pymongo

执行自动加题

也需要修改您的url以及mongoDB配置，以及OJ的管理员的用户名、密码。

url在add_problem.py
MongoDB配置在settings.py
OJ用户名以及密码在config.py
修改zip_dir = "E:\Problem\Testcase\ok"为您重新压缩后的目录。

执行：python add_problem.py

某些bug

因为BZOJ数据问题，可能导致添加题目突然中止，你可能需要执行删除数据库文档的命令，然后重新执行：python add_problem.py即可再次添加题目。

在delete.py中，你需要修改count的值以及for循环的值，删除已经添加得文档。示例如下：

# 删除编号自1200开始，至1245的所有文档数据
for i in range(0, 46):
    count = 1200
    count = count+i
    print(count)
    db.problem.delete_one({"problem_no": str(count)})

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

缘由

数据（某OJ数据&已经解压完成的）

概况

需要安装的软件

准备

解压获取已准备好的BZOJ

安装scrapy

启动爬虫并检查数据库是否存在数据

解压与重新压缩数据

图片位置

安装自动加题所需要的库

某些bug

FilesExpand file tree

README_1.0.md

Latest commit

History

README_1.0.md

File metadata and controls

缘由

数据（某OJ数据&已经解压完成的）

概况

需要安装的软件

准备

解压获取已准备好的BZOJ

安装scrapy

启动爬虫并检查数据库是否存在数据

解压与重新压缩数据

图片位置

安装自动加题所需要的库

某些bug