Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
亦蔚然
Project Crawler Elasticsearch
提交
f86d6711
P
Project Crawler Elasticsearch
项目概览
亦蔚然
/
Project Crawler Elasticsearch
通知
4
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
DevOps
流水线
流水线任务
计划
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
P
Project Crawler Elasticsearch
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
DevOps
DevOps
流水线
流水线任务
计划
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
流水线任务
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
f86d6711
编写于
5月 28, 2021
作者:
W
weiranyi
提交者:
GitHub
5月 28, 2021
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update README.md
将流程图添加回来
上级
aadb8ac7
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
6 addition
and
1 deletion
+6
-1
README.md
README.md
+6
-1
未找到文件。
README.md
浏览文件 @
f86d6711
# 项目:多线程爬虫与Elasticsearch搜索引擎实战
## 需求分析与算法设计:
-
需求:网页中的一个节点开始遍历所有节点
-
算法:使用了广度优先算法的变体
![
img.png
](
https://github.com/weiranyi/JavaProject-Crawler-Elasticsearch/blob/yiweiran/images/flowChart.png?raw=true
)
## 1、迭代内容:
-
版本1:
-
用Java编写一个多线程爬虫,完成HTTP请求、HTML解析等工作,得到数据后放入H2数据库中,借助Flyway将建表、添加原始数据的工作等(自动化)
...
...
@@ -138,4 +143,4 @@ mvn spotbugs:gui
-
ORM对象关系映射
-
索引:
-
MySQL:B+树,数据库全文索引非常慢;Mysql长处是非文本数据的索引
-
Elasticsearch:倒排索引
\ No newline at end of file
-
Elasticsearch:倒排索引
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录