doccano:面向机器学习从业者的开源标注工具

Slow1年前 ⋅ 2595 阅读

https://github.com/doccano/doccano

https://doccano.github.io/doccano/     官网文档

doccano 是一个供人类使用的开源文本注释工具。它为文本分类、序列标记和序列任务提供注释功能。因此,您可以创建用于情感分析、命名实体识别、文本摘要等的标记数据。只需创建一个项目、上传数据并开始注释。您可以在数小时内构建数据集。

transformers 支持零样本文本分类任务了

https://github.com/huggingface/transformers/blob/main/examples/research_projects/zero-shot-distillation/README.md

@sleep0902  标注后的数据进行文本分类训练效果更好,且复杂的需要人工标注而无法做到零样本建模

全部评论: 0

    相关推荐