Skip to content
体验新版
项目
组织
正在加载...
登录
切换导航
打开侧边栏
OpenDocCN
fasttext-doc-zh
提交
ddfe7bbe
F
fasttext-doc-zh
项目概览
OpenDocCN
/
fasttext-doc-zh
通知
1
Star
0
Fork
0
代码
文件
提交
分支
Tags
贡献者
分支图
Diff
Issue
0
列表
看板
标记
里程碑
合并请求
0
Wiki
0
Wiki
分析
仓库
DevOps
项目成员
Pages
F
fasttext-doc-zh
项目概览
项目概览
详情
发布
仓库
仓库
文件
提交
分支
标签
贡献者
分支图
比较
Issue
0
Issue
0
列表
看板
标记
里程碑
合并请求
0
合并请求
0
Pages
分析
分析
仓库分析
DevOps
Wiki
0
Wiki
成员
成员
收起侧边栏
关闭侧边栏
动态
分支图
创建新Issue
提交
Issue看板
前往新版Gitcode,体验更适合开发者的 AI 搜索 >>
未验证
提交
ddfe7bbe
编写于
4月 25, 2018
作者:
K
Keqi Huang
提交者:
GitHub
4月 25, 2018
浏览文件
操作
浏览文件
下载
电子邮件补丁
差异文件
Update language-identification.md
上级
a38fa931
变更
1
隐藏空白更改
内联
并排
Showing
1 changed file
with
4 addition
and
4 deletion
+4
-4
doc/zh/language-identification.md
doc/zh/language-identification.md
+4
-4
未找到文件。
doc/zh/language-identification.md
浏览文件 @
ddfe7bbe
...
...
@@ -5,14 +5,14 @@ title: Language identification
### 说明
我们发布了两种语言识别模型,可以识别
176种语言(请参阅下面的ISO代码列表)。 这些模型是通过
[
Wikipedia
](
https://www.wikipedia.org/
)
,
[
Tatoeba
](
https://tatoeba.org/eng/
)
和
[
SETimes
](
http://nlp.ffzg.hr/resources/corpora/setimes/
)
的数据进行训练
,在
[
CC-BY-SA
](
http://creativecommons.org/licenses/by-sa/3.0/
)
下使用。
我们发布了两种语言识别模型,可以识别
176 种语言(请参阅下面的 ISO 代码列表)。 这些模型是通过
[
Wikipedia
](
https://www.wikipedia.org/
)
,
[
Tatoeba
](
https://tatoeba.org/eng/
)
和
[
SETimes
](
http://nlp.ffzg.hr/resources/corpora/setimes/
)
的数据进行训练的
,在
[
CC-BY-SA
](
http://creativecommons.org/licenses/by-sa/3.0/
)
下使用。
我们发布两个版本的模型:
*
[
lid.176.bin
](
https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.bin
)
,这个模型更快更准确,但有一个文件的大小有
126
MB;
*
[
lid.176.ftz
](
https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.ftz
)
,这是个只有
917kB
的压缩版的模型。
*
[
lid.176.bin
](
https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.bin
)
,这个模型更快更准确,但有一个文件的大小有
126
MB;
*
[
lid.176.ftz
](
https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.ftz
)
,这是个只有
917 kB
的压缩版的模型。
这些模型都是使用
UTF-8数据进行训练的,因此需要使用UTF-8
作为输入。
这些模型都是使用
UTF-8 数据进行训练的,因此需要使用 UTF-8
作为输入。
### 许可
...
...
编辑
预览
Markdown
is supported
0%
请重试
或
添加新附件
.
添加附件
取消
You are about to add
0
people
to the discussion. Proceed with caution.
先完成此消息的编辑!
取消
想要评论请
注册
或
登录