You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
Hui Zhang
71e046b0ba
|
4 years ago | |
---|---|---|
.. | ||
.bumpversion.cfg | 4 years ago | |
.gitignore | 4 years ago | |
.travis.yml | 4 years ago | |
CHANGELOG.md | 4 years ago | |
LICENSE | 4 years ago | |
Makefile | 4 years ago | |
README.md | 4 years ago | |
cc_cedict.txt | 4 years ago | |
get_latest_cc_cedict.py | 4 years ago | |
large_pinyin.txt | 4 years ago | |
merge.py | 4 years ago | |
overwrite.txt | 4 years ago | |
parse_latest_cc_cedict.py | 4 years ago | |
pinyin.txt | 4 years ago | |
requirements_dev.txt | 4 years ago | |
zdic_cibs.txt | 4 years ago | |
zdic_cybs.txt | 4 years ago |
README.md
phrase-pinyin-data
词语拼音数据。
数据介绍
拼音数据的格式:
{phrase}: {pinyin}
-
以
#
开头的行是注释 -
行尾的
#
也是注释 -
{phrase}
汉字词语 -
{pinyin}
词语的拼音,使用空格分隔每个汉字的拼音 -
一行一个词语的读音,有多个音的词语会出现在多行
-
示例:
# 注释 中国: zhōng guó 北京: běi jīng # 注释
文件说明:
overwrite.txt
: 手工纠正的拼音数据pinyin.txt
:pinyin.txt + overwrite.txt
后的拼音数据zdic_cibs.txt
: 汉典网 汉语词典拼音数据zdic_cybs.txt
: 汉典网 成语词典拼音数据cc_cedict.txt
: cc-cedict.org 拼音数据large_pinyin.txt
:zdic_cibs.txt + zdic_cybs.txt + cc_cedict.txt + pinyin.txt + overwrite.txt
后的拼音数据
修改数据
- 修改
pinyin.txt
或overwrite.txt
都可以了 - 执行
make merge
命令可以按照合并规则生成最新的pinyin.txt
参考资料
- 初始数据基于 phrases-dict.js 和 phrases_dict.py
- 汉典 zdic.net
- 字海网,叶典网
- 国学大师_国学网
- CC-CEDICT download - MDBG English to Chinese dictionary
- 漢語大詞典
相关项目
- mozillazg/pinyin-data: 汉字拼音数据