量子位 | 公众号 QbitAI
艾瑞巴得,又有神器来拯救文盲了!
景象太热只会念叨一句“热去世了”?发朋友圈翻来覆去才憋出几个字?
这个检索神器值得理解一下。
只要在搜索框里输入你想表达的意思,如“热去世了”。
急速就能有20个表达这一意思的句子任君挑选。
句子类型还能按需选取,名言警句、歇后语、古诗文都不在话下。
并且给出的名言还会注明出处作者,这下再也不用啥话都往迅哥儿身上套了。
怪不得网友直呼:朋友圈文案高等表达查找更换系统。
而且,我们在试玩了几轮后创造,这个神器在hold住网络俚语“精髓”上的表现有些出人意料。
比如这两天算夜家都在说的“精神内耗”。
它给出了一段卢梭的话,完备拿捏住了词语本来的意思,措辞逼格立马提升好几度。
乃至还能找出意思附近的古诗文。
来自欧阳修《秋声赋》中的这句“百忧感其心,万事劳其形,有动乎中,必遥其情”,说的意思便是焦虑使人精神怠倦。
果真是能通杀古今了。
于是,我们找来了更多网络盛行语喂给它,看看还能擦出什么火花~
听我说感激你,但古诗版第一个要考试测验的网络名句,是“听我说,感激你”。
神器反向输出结果中,意思最为贴近的是王维的这句“全球无相识,终生思旧恩”。
这句诗中明确表示了说话主体人表达感谢之意,称得上是“听我说感激你”的究极上流版。
还有在句式上非常靠近的结果,是温庭筠笔下的“知我意,感君怜”。
最让人意想不到的,是神器反向输出了《将进酒》里的“与君歌一曲,请君为我倾耳听”。
乍看之下,这个答案彷佛是错的。
但要知道“听我说感激你”能成为梗,便是由于防疫职员尴尬被迫听歌事宜……
这么看,反向输入迷器还意外扣了题。
不但是这句梗,还有很多网络用语,反向输入迷器的回答都是貌似不着边际,但又让人以为非常契合。
比如输入“无语子”,给出的诗句有:
满怀心腹事,尽在不言中。
这不便是大家表达无语时的真实心境吗?由于不便明说,以是沉默,以是无语。
还有这句“你品,你细品”,输出的诗句也都带有了仔细品读、反复回味的意思。
那么,这个好用又好玩的神器,到底是什么来头呢?
来自清华的“据意查句”以上说的这个好登西,是由清华推出的“据意查句”神器——WantQuotes。
出身自清华大学打算机系自然措辞处理与社会人文打算实验室(THUNLP),项目辅导西席为孙茂松教授和刘知远副教授。
能够快速从全天下这么多语估中找到你想要的句子,这个神器紧张靠的是一个超大的数据集和一个推举模型。
数据集包含了英语、当代汉语和文言文三大部分。
个中,英语部分有6108个名言警句和126713个高下文文本段;
当代汉语部分,包含有3004句名言和408433个干系高下文;
文言文部分,则有4438段文言典故(包括古诗)和116537段干系高下文。
推举模型方面,本文提出利用BERT作为句子编码器来学习名言警句和干系文本表示。
但由于绝大多数名言警句的表达都非常凝练,但是可能个中每个背后的意义又包含很多层,以是在本方法中,研究职员将义原引入到编码器中。
大略来说,义原是措辞学中最小的语义单位。措辞学家认为义原体系在任何措辞中都适用,不与特定措辞干系。
举个例子,“男孩”这个词可以由“人类”、“男性”、“儿童”这个三个义原表示,“女孩”则可以由“人类”、“女性”、“儿童”的组合来表达。
因此在模型中引入义原后,就能很好办理词义消歧的问题,并且能更准确地捕捉到词与词之间的关系。
也便是让模型把措辞学得更加透彻。
而在详细任务比拟中可以看到,本文方法的性能均优于其他方法。
同时用溶解实验验证了演习方法的有效性(下表末了三行结果)。
在只给出左侧文本的条件下,本文方法的结果依旧优于过去方法。
还有反向词典和AI作诗系统
看到这里你可能以为这项事情有点似曾相识。
没错,那个之前爆火的“反向词典”也来自这个实验室。
所谓“反向”,便是和常规词典不同,不是按词寻义,而是反过来给词典一段描述,让它来帮你找词。
比如还是这句“听我说感激你,由于有你,温暖了四季”,用针言该当怎么说?
反向词典可以立马抛出几十乃至上百个选项出来,并且还会标注推举程度。
背景颜色越深,代表系统推举程度越高。
假如碰上啥看不懂的,鼠标一点,就能查看详细释义。
而除了拯救当代失落语人外,他们还让AI考试测验过写古诗,之前也在网络上爆火过。
不得不说,THUNLP真是要把AI+中文玩出花了。
该实验室由孙茂松教授领衔,西席军队中还有刘洋教授和刘知远副教授。
前不久,THUNLP还得到了ACL 2022最佳演示论文奖(Best Demo Paper Award)。
该奖项是ACL系列会议对System Demonstration论文付与的最佳论文奖项,每届会议基于评审职员评估的系统贡献度、完成度、影响力及会议演示综合效果的综合评价评比出一篇获奖论文。
One More Thing
目前,“反向词典”在网页端和微信小程序上都能利用,APP在路上了。
“据意查句”还只能在网页端利用(须要扫码关注"大众年夜众号上岸一下子)。
其余,团队表示还是希望大家在利用时多给反馈、多提建议。
比如给好的推举名句点赞,如果看到有缺点之处也能直接示正。
对了,研发团队还表示,作为开源项目随时欢迎大家加入,参与项目设计&开拓、提出需求、反馈问题。
感兴趣的话就辞官网戳戳公告吧~
“据意查句”官网:https://wantquotes.net/
“反向词典”官网:https://wantwords.net/
参考链接:https://weibo.com/5198011111/LE58vxn0N?
— 完 —
量子位 QbitAI · 头条号签约
关注我们,第一韶光获知前沿科技动态