未验证 提交 f86d6711 编写于 作者: W weiranyi 提交者: GitHub

Update README.md

将流程图添加回来
上级 aadb8ac7
# 项目:多线程爬虫与Elasticsearch搜索引擎实战
## 需求分析与算法设计:
- 需求:网页中的一个节点开始遍历所有节点
- 算法:使用了广度优先算法的变体
![img.png](https://github.com/weiranyi/JavaProject-Crawler-Elasticsearch/blob/yiweiran/images/flowChart.png?raw=true)
## 1、迭代内容:
- 版本1:
- 用Java编写一个多线程爬虫,完成HTTP请求、HTML解析等工作,得到数据后放入H2数据库中,借助Flyway将建表、添加原始数据的工作等(自动化)
......@@ -138,4 +143,4 @@ mvn spotbugs:gui
- ORM对象关系映射
- 索引:
- MySQL:B+树,数据库全文索引非常慢;Mysql长处是非文本数据的索引
- Elasticsearch:倒排索引
\ No newline at end of file
- Elasticsearch:倒排索引
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册