- # 文本文件必须是 utf-8 无 bom 格式
- from gensim.models.deprecated.word2vec import Word2Vec
- model = Word2Vec.load('./model/Word60.model') # 3 个文件放在一起: Word60.model Word60.model.syn0.npy Word60.model.syn1neg.npy
- print("read model successful")
- word_list = ['了',
- '不存在的词',
- '的',
- '我',
- '你',
- '他',
- '个',
- '1',
- '完成',
- '吃',
- '苹果',
- '香蕉',
- '词汇',
- '物理',
- '地球',
- '黑死病',
- '瘟疫',
- '', ]
- for word in word_list:
- if word in model.index2word:
- vec = model[word]
- print(word,vec)
- else:
- print(word + '\t\t\t-- 不在词汇表里' + '\n\n')
模型文件如下:
链接: https://pan.baidu.com/s/1c7V91VcWbHPBFIfmtWGb2g 密码: mgps
如果分享失效可以留言或者邮件联系.
来源: http://www.bubuko.com/infodetail-2571825.html