NLP自然语言处理系列- week7- 检索模型(精排)(8)

NLP自然语言处理系列- week7- 检索模型(精排)(8)

检索模型(精排)排序模块步骤:

  1. 处理数据
  2. ⼈⼯特征
  3. 深度匹配
  4. 排序
  5. 整合

数据预处理

微众银行提供了微众银行智能客服问句匹配的语料支持,针对中文的客服语料,进行问句意图匹配,给定两个语句,要求判定两者意图是否相同或者相近。
输入:一个语句对
输出:表明该语句对是否表达相同或者相似意图的二值标签(0或1)

示例: 样例1
输入:一般几天能通过审核\ t一般审核通过要多久 输出:1

样例2
输入:一般会在什么时候来电话\ t一直在等待电话通知 输出:0
question1 question2 label
示例:
但是没联系我啊 \t ⼀直在审核中,也没接到电话啊 1
段智华 CSDN认证博客专家 Spark AI 企业级AI技术
本人从事大数据人工智能开发和运维工作十余年,码龄5年,深入研究Spark源码,参与王家林大咖主编出版Spark+AI系列图书5本,清华大学出版社最新出版2本新书《Spark大数据商业实战三部曲:内核解密|商业案例|性能调优》第二版、《企业级AI技术内幕:深度学习框架开发+机器学习案例实战+Alluxio解密》,《企业级AI技术内幕》新书分为盘古人工智能框架开发专题篇、机器学习案例实战篇、分布式内存管理系统Alluxio解密篇。Spark新书第二版以数据智能为灵魂,包括内核解密篇,商业案例篇,性能调优篇和Spark+AI解密篇。从2015年开始撰写博文,累计原创1059篇,博客阅读量达155万次
已标记关键词 清除标记
相关推荐
英文名:Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition Stanford大学的 Dan Jurafsky编著的经典NLP入门教材,Speech and Language Processing(自然语言处理综论)的中译本,本书英文版出版之后好评如潮,国外许多著名大学纷纷把本书选为自然语言处理和计算语言学课程的主要教材,该书被誉为该领域教材的“黄金标准”。本书包含的内容十分丰富,分为四个部分,共21章,深入细致地探讨了计算机处理自然语言的词汇、句法、语义、语用等各个方面的问题,介绍了自然语言处理的各种现代技术。从层次的角度看,本书的论述是按照自然语言的不同层面逐步展开的,首先论述单词的自动形态分析,接着论述自动句法分析,然后论述各种语言单位的自动语义分析,最后论述连贯文本的自动分析、对话与会话的智能代理以及自然语言生成。从技术的角度看,本书介绍了正则表达式、有限状态自动机、文本-语音转换、发音与拼写的概率模型、词类自动标注、n元语法、隐马尔可夫模型、上下文无关语法、特征与合一、词汇化剖析与概率剖析、一阶谓词演算、词义歧、修辞结构理论、机器翻译等非常广泛的内容。本书具有“覆盖全面、注重实用、强调评测、语料为本”四大特色。在本书的配套网站上,还提供了相关的资源和工具,便于读者在实践中进一步提高。    本书不仅可以作为高等学校自然语言处理和计算语言学等课程的本科生和研究生教材,而且也是从事自然语言处理相关领域的研究人员和技术人员的必备参考。
©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页
实付 19.90元
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值