Trevor 访问了Writefull (Digital Science) 的首席应用语言学家 Hilde van Zeeland。立即收听以了解人工智能如何帮助您在撰写下一篇研究论文时检查学术英语。
好的。你们的网站上说,它是根据数百万篇已发表的研究文章作为参考文本,进行人工智能进修的,这包括了哪些类型的文章?是否只来自开放获取的同行评审期刊?
是的,这些都是开放获取的同行评议的文章,而且是我们可以获得的,其中一个供应商是Hindawi,他们在网上提供他们的稿件以供处理,这是我们进行人工智能进修
的资源之一
其中一个数据源
好的,不是所有的期刊都经过同行评审,不是所有的期刊都进行编辑。发表的论文仍然可能有语言错误
那么,人工智能会考虑到这一点吗?或者人工处理是如何参与质量微调的?
是的, 我们需要人工微调。同行评议并不能保证稿件的质量高,在把稿件加到人工智能进修数据集之前,我们也不能保证稿件质量。所以,我和另一位应用语言学的团队成员,在最开始的时候,当我们还在收集和开始人工智能进修的时候会进行处理模型的输出。
我们看不同领域的不同稿件,不同作者用不同的母语写的。我们会统计不同反馈类型的出现次数,看看模型在哪里失败了,比如在文章中 我们一开始就经常看到模型会过度使用一些词。例如 在名词前加" the "或" a ",这是ok的。但是没必要加,我们需要标记所有的病句,这是一个非常费力的工作。
然后我们的开发人员会用它来调整和微调模型,这就是我们如何确保高质量并保持高水平的方法
好的,当您设计这个软件的时候,您遇到过或者必须考虑的挑战是什么?
这些挑战出现在不同的学科或文章类型?还是出现在通用语言和专业语言的区别上?
对于AI 进修数据集,我们基本上只是把所有数据放在一起。在模型或语言反馈方面,不同学科之间没有区别,后来我们在不同领域的稿件上进行了测试,没有发现区别。因此它适用于STEM(科学 技术 工程 数学) ,也适用于艺术 人文和社会科学,我们了解的是,例如公式或文本中的其他部分可能会带来问题,因为有时它们被作为图像包含在稿件中。在这种情况下,它们如果被去掉了,句子就不完整了
或者有时它们以不同的符号的形式出现在AI进修时使用的纯文本中,它们无法被当作正常的语言来阅读,当您处理含有公式或符号的文本时,这是一个棘手的问题
这是我们在AI进修和产出中发现的东西,我们也在不断努力改善
好的。一些媒体新闻文章公布 Writefull 刚刚上线不久,但实际上在文章之前就已经上线了。
那么,这个软件最新的上线情况如何?
是的,Writefull已经上线好几年了。以前叫做 Writefullapp,但它只提供统计数据和语言搜索引擎。
我们最近推出的叫Full Edit,它是全新的 完全基于人工智能的语言反馈模式。
我之前也提到过多家公司对它进行过分析,有一个大型出版商非常关注它,还有两家科学语言编辑公司和一家普通的文字编辑公司。他们研究了Writefull和其他一些语言工具,看看它们的运行效果如何,以及我们应该使用哪些工具来。对提交的稿件进行分类或者在实际的编辑过程中提供帮助,他们都认为Writefull比其他工具更好,这对我们来说是非常积极的消息,这是一个新的Full Edit模式。
我们通常做的是……那些自己手写编辑稿件的编辑,经常说原来人工智能竟然可以做到这样,已经这么先进了
那么编辑们是怎么使用它的呢?例如进行第一次检查,然后再清理?
是的,有些人就是这么做的,有些人甚至在整个编辑过程中都这么做。他们先用Writefull来检查稿件,查看更正,有时他们直接就接受更正。当然,它们也会自己进行人工检查。
好的在未来,你们打算做哪些改进或额外的功能呢?
对 Writefull 首先我们想增加的是英式英语/美式英语选项,供作者选择……
也可以供期刊或出版商选择,例如,用户可以选择这样的表达 This is the check that I want
这是我们在后端已经准备好的,但仍然需要推送到实际应用中
我们还在开发一些独立的小工具,比如自动释义 用于科学写作
我们也计划在未来将其添加到应用程序中
那么,软件拼写的语言是什么,英式英语还是美式英语呢?
目前我们没有做这个区分,大部分都是美式英语的
但是这是在后端 基本上……这么说吧,在前端,用户需要进行选择。然后在后端,学数据都是美式英语的。我们为他们解决问题,所以我们会根据用户的选择来推送编辑
好的,你们现在有什么特别的计划或方案吗?Writefull是如何帮助英语为第二语言或外语的研究人员的?
它不一定只面向非英语母语者,但我确实认为大多数使用Writefull的作者都是非英语母语者。
我们听说出版商在投稿前,会使用Writefull,在投稿前为作者提供一个快速的语言检查
我们也从出版商那里听说,他们这样做主要是为了减少语言障碍,因为他们也意识到,糟糕的语言质量会使评估稿件变得更加困难,他们也认为这是个问题,为了给每个人公平的机会,让他们的稿件得到公平的评价,他们也会使用语言检查
所以有些出版商把它当做筛选工具?它会打分吗?
有些是的,有些人用它来分类,以便快速查看提交的稿件的质量。其实很多人会把它推给作者,当作者准备在期刊的,提交页面上提交稿件时,他会收到一个弹出窗口,或一个通知--"在您提交之前 也许您想通过 Writefull 浏览您的稿件,希望能提高您的稿件的语言质量"
明白,所以在他们提交前,有一个检查修改的步骤用来减少直接拒稿率。
好的。另外,您如何看待人工智能,在未来的学术出版中扮演的角色?编辑、质量控制或其他决策还需要人工处理吗?
是的,我确实认为人工智能。我们也看到人工智能在科学出版中会变得越来越重要,它已经被用来检查语言,修改语言。它也会被用来对稿件进行实际的语言检查。例如,看看是否有互相矛盾的句子,在自动总结方面,人工智能发展非常迅速
所以我也可以想象,它可能很快也会被用来帮助作者写摘要。例如,您也有工具,我们 Writefull 也这样做,为稿件提供自动的结构检查,所以这些会变成很基本的操作,例如,表格符合要求吗?参考资料或作者符合要求吗?等等,这不是人工智能。
但我认为人工智能在结构检查,方面也会变得很重要。例如 这段文本是否给出了对该表的准确描述?这就是人工智能,因为您需要识别图像中的内容,您需要识别理解与图像相关的文本,这些都至少可以部分自动完成。所以不是真的要取代编辑员,但肯定会让过程更有效率
好的,您对那些正在或即将准备英文稿件的听众有什么建议?
写作的时候先把精力集中在内容上是很重要的,尤其是当您在考虑怎么写的时候,同时您不是英语为母语的人。当您的英语还不是很熟练时,一开始就想把语言表达,做到完美是很难的,所以最好是先写内容 用头脑风暴来写也ok。
写下来后,然后第三步润色
在进行润色时,您可以使用 Writefull 或您喜欢的任何其他语言工具,以确保语言是正确的
但重要的是不要一开始就这样,因为那样真的会破坏整个写作流程。
是的,我同意。最后,是什么让您对应用语言学感兴趣?作为一名将英语作为第二语言的研究人员,您有什么想分享的?
我一直对人们如何使用和学第二语言很感兴趣,甚至在中学的时候,我就已经很清楚,我们的英语老师会如何教我们,不同的学生会如何处理进修材料。虽然那时我不知道这是一个研究领域
我后来才发现,有一种叫应用语言学的东西,是关于人们如何使用和学得一门语言的,这是后来的事了。我也确实认为,当我开始用英语写学术文章时,我也很清楚我是如何进修语言的。
那时我经常用谷歌查短语和单词,来看看人们会如何使用它们,这也是我们后来创建Writefull的初衷
我认为把重点明确地放在人们如何写作,人们如何使用这个词上,也是很有效的。我从中学到了很多
那么,您的母语是?
荷兰语
啊,您的母语是荷兰语。那您几岁开始学英语的?
是的,电视和收音机等等,很多媒体实际上是英语的。所以我很早就开始接触英语,准确来说在小学结束时,我真正开始使用英语
好的,现在我有一个奇怪的问题,您用什么语言思考?
还是说这取决于您是用英语写作还是用英语思考?
是的,这个问题很有意思。我主要用英语思考,尤其在工作时。
好的。Hilde 非常感谢您今天担任我们的嘉宾,为我们提供了一些语言和写作技巧 谢谢!
不客气。谢谢你们的邀请
感谢收听本期的 AsiaEdit et al 播客节目,欲了解更多关于发表论文的建议,请访问asiaedit.com
我是Trevor Lane 下一期我们将,讨论更多发表论文的专业技巧

