You can not select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
55 lines
1.9 KiB
55 lines
1.9 KiB
# phrase-pinyin-data [![Build Status](https://travis-ci.org/mozillazg/phrase-pinyin-data.svg?branch=master)](https://travis-ci.org/mozillazg/phrase-pinyin-data)
|
|
|
|
词语拼音数据。
|
|
|
|
|
|
## 数据介绍
|
|
|
|
拼音数据的格式:
|
|
|
|
```
|
|
{phrase}: {pinyin}
|
|
```
|
|
|
|
* 以 `#` 开头的行是注释
|
|
* 行尾的 `#` 也是注释
|
|
* `{phrase}` 汉字词语
|
|
* `{pinyin}` 词语的拼音,使用空格分隔每个汉字的拼音
|
|
* 一行一个词语的读音,有多个音的词语会出现在多行
|
|
* 示例:
|
|
|
|
```
|
|
# 注释
|
|
中国: zhōng guó
|
|
北京: běi jīng # 注释
|
|
```
|
|
|
|
文件说明:
|
|
|
|
* `overwrite.txt`: 手工纠正的拼音数据
|
|
* `pinyin.txt`: `pinyin.txt + overwrite.txt` 后的拼音数据
|
|
* `zdic_cibs.txt`: [汉典网](http://www.zdic.net/) 汉语词典拼音数据
|
|
* `zdic_cybs.txt`: [汉典网](http://www.zdic.net/) 成语词典拼音数据
|
|
* `cc_cedict.txt`: [cc-cedict.org](https://cc-cedict.org/) 拼音数据
|
|
* `large_pinyin.txt`: `zdic_cibs.txt + zdic_cybs.txt + cc_cedict.txt + pinyin.txt + overwrite.txt` 后的拼音数据
|
|
|
|
## 修改数据
|
|
|
|
* 修改 `pinyin.txt` 或 `overwrite.txt` 都可以了
|
|
* 执行 `make merge` 命令可以按照合并规则生成最新的 `pinyin.txt`
|
|
|
|
|
|
## 参考资料
|
|
|
|
* 初始数据基于 [phrases-dict.js](https://github.com/hotoo/pinyin/blob/05f74496c34ccb32db1a0fd0b358a798a22a51e5/data/phrases-dict.js) 和 [phrases_dict.py](https://github.com/mozillazg/python-pinyin/blob/366de0363ff1fb9a718ce668448bea59de09a4bf/pypinyin/phrases_dict.py)
|
|
* [汉典 zdic.net](http://www.zdic.net/)
|
|
* [字海网,叶典网](http://zisea.com/)
|
|
* [国学大师_国学网](http://www.guoxuedashi.com/)
|
|
* [CC-CEDICT download - MDBG English to Chinese dictionary](http://www.mdbg.net/chindict/chindict.php?page=cc-cedict)
|
|
* [漢語大詞典](http://www.ivantsoi.com/hydcd/search.html)
|
|
|
|
|
|
## 相关项目
|
|
|
|
* [mozillazg/pinyin-data](https://github.com/mozillazg/pinyin-data): 汉字拼音数据
|