未验证 提交 ddfe7bbe 编写于 作者: K Keqi Huang 提交者: GitHub

Update language-identification.md

上级 a38fa931
......@@ -5,14 +5,14 @@ title: Language identification
### 说明
我们发布了两种语言识别模型,可以识别176种语言(请参阅下面的ISO代码列表)。 这些模型是通过 [Wikipedia](https://www.wikipedia.org/)[Tatoeba](https://tatoeba.org/eng/)[SETimes](http://nlp.ffzg.hr/resources/corpora/setimes/) 的数据进行训练,在 [CC-BY-SA](http://creativecommons.org/licenses/by-sa/3.0/) 下使用。
我们发布了两种语言识别模型,可以识别 176 种语言(请参阅下面的 ISO 代码列表)。 这些模型是通过 [Wikipedia](https://www.wikipedia.org/)[Tatoeba](https://tatoeba.org/eng/)[SETimes](http://nlp.ffzg.hr/resources/corpora/setimes/) 的数据进行训练的,在 [CC-BY-SA](http://creativecommons.org/licenses/by-sa/3.0/) 下使用。
我们发布两个版本的模型:
* [lid.176.bin](https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.bin) ,这个模型更快更准确,但有一个文件的大小有126MB;
* [lid.176.ftz](https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.ftz) ,这是个只有917kB的压缩版的模型。
* [lid.176.bin](https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.bin) ,这个模型更快更准确,但有一个文件的大小有 126 MB;
* [lid.176.ftz](https://s3-us-west-1.amazonaws.com/fasttext-vectors/supervised_models/lid.176.ftz) ,这是个只有 917 kB 的压缩版的模型。
这些模型都是使用UTF-8数据进行训练的,因此需要使用UTF-8作为输入。
这些模型都是使用 UTF-8 数据进行训练的,因此需要使用 UTF-8 作为输入。
### 许可
......
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册