文本分类

应用场景:搜索,对话

比如细分意图,为下游处理做准备

image-20210911211343841

分类模型

image-20210911211457248

fasttext和textcnn

image-20210911211546593

Bert-cls

image-20210911212314679

分类方法

规则&词典

image-20210911213141748

算法题:前缀树

以搜代分

image-20210911213931751

分类系统

image-20210911214704221

多分类和多标签

image-20210911214949912

样本:

  • 比如query中,音乐可以用“我想听...”这样的规则去抽取正样本,然后随机抽取其它的作为负样本。得到粗样本,根据评测集再去做逐步迭代和修正。

参考资料

文本多分类踩过的坑(多分类经验:数据不均衡问题,调参等)

基于深度学习的文本分类

Last updated

Was this helpful?