ChatGPT可能学习过的七个课程
出于简单的好奇心,我对GPT可能学习了什么感到好奇。直接学习数据和类型似乎有点无聊,因此我查阅了自然语言处理研究领域正在解决的问题类型。
Papers with Code 网站将583个自然语言处理研究主题分类,每个主题意味着“全球的研究人员都在研究同一个问题”。很可能这些问题类型已经包含在GPT的广泛内容学习的小型课程中。
其中,我选择了与日常生活密切相关的七个主题。
数据生成文本
这个研究主题涉及从常见的“表格”数据中生成描述性文本。对于像我这样的数据分析师来说,这是一个必要的研究,同时也是一个影响就业的研究(GPT不是唯一影响就业的东西,对吧?)。
对于机器来说,如果给予它们太多自由想象或注入意图,描述和解释数据可能会很棘手。首先,它必须准确地表达。而且这种描述并不简单。它必须同时解决各种子主题,例如要解释什么、要关注什么以及要使用什么表达方式来增加清晰度。
文本风格转换
如果在声乐研究中有“声音模仿”,在自然语言处理中就有“风格转换”。例如,它是一种在保持句子相同意义的情况下改变不同讲话者的语音风格的技术。
你可以将“舒适的语气”转换为“愤怒的说话方式”,将“男性风格”转换为“女性说话者的风格”,将“孩子般的词汇和句子”转换为“成年人的语法”。
例如,将埃隆·马斯克关于SpaceX的技术解释转换为哈利·波特的演讲风格。这是一种在保持句子相同意义的情况下改变不同讲话者风格的技术。
临床语言翻译
当我们的症状超出了轻微感冒时,即使我们听到医生用我们的母语进行诊断,也会感觉像外星语言。为了弥合这个差距,有一个研究领域将充满专业术语的医学文本翻译成公众可以理解的语言。
意图分类
简单来说,这是一项研究,旨在理解即使某人没有明确说出意图,也能理解他们的意思。例如,在商业服务中,它可以帮助确定某人是否想要购买、升级到更昂贵的订阅还是取消订阅。如果是一个聊天机器人,它可以从用户留下的几个词中识别相关主题,并提供用户可能会找到有用的信息。
故事补全
这项研究旨在填补故事中的缺失部分,即使情节不完全。这可能包括猜测并无缝连接主要文本的缺失部分,而不仅仅是结论。如果故事中包含过多的技术术语或需要大量背景知识,可以提供注释来帮助读者理解。
这项研究的实用性不仅限于小说,还可以应用于日常生活。许多人陷入“知识的诅咒”中,假设别人已经知道他们所知道的。如果故事补全模型能够作为知识的中介者介入,那将是有帮助的。
视觉叙事
如果提供一张一个人从曼哈顿车站跑出来的图片,可以编写两个版本的解释,如下所示。
- “有一个人在曼哈顿车站的第二个出口跑步。旁边有一棵树、一条路和一辆车。”
- “今天又迟到了。”
人们可以理解上下文并从一张单独的图片中创造一个故事。然而,对于人工智能来说,这是一项困难的任务。提供连接多个图片形成连贯故事的上下文,并最终生成句子,是视觉叙事研究中的另一个层次。
概念到文本生成
“基于概念生成文本”与之前提到的”故事补全”略有不同。虽然故事补全研究填补了一个空白的上下文,但这次介绍的研究是根据几个给定的词生成一个合理的句子。
这次我也给GPT4分配了一个任务。我让它用四个词组成一个句子:”早上、咖啡、面包、地铁”。对于GPT来说,这似乎是一个容易的任务。
他早上起床,给自己倒了一杯咖啡,咬了一口温热的面包,然后去地铁站上班。
本文选出的内容只是各种研究主题的一小部分。除了自然语言处理,人工智能研究领域还包括语音识别、图像/视频生成等等,无穷无尽。您还可以通过浏览已经研究的主题来开展头脑风暴,思考:”我学过这些类型,所以我可以通过那些类型的问题来扩展。”请访问这个网站,探索一些伟大的想法。