Expose sentence to vector fn

99799847 · Hai Liang Wang · 5a37ca52 · 99799847 · 99799847 · 99799847
隐藏空白更改
内联并排

Showing with 29 addition and 1 deletion

CHANGELOG.md CHANGELOG.md +10 -0

README.md README.md +9 -0

setup.py setup.py +1 -1

synonyms/synonyms.py synonyms/synonyms.py +9 -0

未找到文件。
--- a/CHANGELOG.md
+++ b/CHANGELOG.md
 # 3.8
+* 获得一个分词后句子的向量，向量以BoW方式组成
+
+
+```
+    sentence: 句子是分词后通过空格联合起来
+    ignore: 是否忽略OOV，False时，随机生成一个向量
+```
+
+
+# 3.7
 * change import path of utils in word2vec.py to local path
 * expose vector fn


--- a/README.md
+++ b/README.md
@@ -127,6 +127,15 @@ array([-2.412167  ,  2.2628384 , -7.0214124 ,  3.9381874 ,  0.8219283 ,
      dtype=float32)
 ```

+### synonyms#sv(sentence, ignore=False)
+获得一个分词后句子的向量，向量以BoW方式组成
+
+```
+    sentence: 句子是分词后通过空格联合起来
+    ignore: 是否忽略OOV，False时，随机生成一个向量
+```
+
+
 ## PCA
 以“人脸”为例主要成分分析：


--- a/setup.py
+++ b/setup.py
@@ -13,7 +13,7 @@ Welcome

 setup(
    name='synonyms',
-    version='3.7.0',
+    version='3.8.0',
    description='Chinese Synonyms for Natural Language Processing and Understanding',
    long_description=LONGDOC,
    author='Hai Liang Wang, Hu Ying Xi',

--- a/synonyms/synonyms.py
+++ b/synonyms/synonyms.py
@@ -206,6 +206,15 @@ def _levenshtein_distance(sentence1, sentence2):
    # print("smoothing[%s| %s]: %s -> %s" % (sentence1, sentence2, d, s))
    return s

+def sv(sentence, ignore=False):
+    '''
+    获得一个分词后句子的向量，向量以BoW方式组成
+    sentence: 句子是分词后通过空格联合起来
+    ignore: 是否忽略OOV，False时，随机生成一个向量
+    '''
+    return _get_wv(sentence, ignore = ignore)
+
+
 def v(word):
    '''
    获得一个词语的向量，OOV时抛出 KeyError 异常