Metadata-Version: 2.1
Name: cutcut
Version: 0.0.1
Summary: General tokenizer
Home-page: https://github.com/ljv006/cutcut
Author: ljv006
Author-email: longjw6@qq.com
License: MIT
Platform: UNKNOWN
Classifier: Development Status :: 3 - Alpha
Classifier: Intended Audience :: Developers
Classifier: Topic :: Software Development :: Build Tools
Classifier: License :: OSI Approved :: MIT License
Classifier: Programming Language :: Python :: 3.6
Classifier: Programming Language :: Python :: 3.7
Classifier: Programming Language :: Python :: 3.8
Requires-Python: >=3.6
Description-Content-Type: text/markdown
Requires-Dist: bert-for-tf2
Requires-Dist: tensorflow (>=2.0.0)

<!--
 * @Author: 龙嘉伟
 * @Date: 2021-06-30 15:35:33
 * @LastEditors: 龙嘉伟
 * @LastEditTime: 2021-06-30 15:41:06
 * @Description: 
-->
# cutcut通用分词工具
### 在开源数据上使用albert进行实体识别，切分句子，得到对应的单词序列。
## 更新说明
### 2021-06-30
- 基本完成分词功能，后期需要增加自定义词典及自定义词添加。
- 将模型打包成wheel格式，使用pip进行安装。

## 使用说明
  1. 调用get_wheel.sh生成安装文件，在dist目录下；
  2. 使用pip install XXX.whl文件；
  3. 在python中使用import cutcut引入分词包；
  4. 使用cutcut.lcut进行分词。

