为科研文章而设的自动化语法检查 (上)AsiaEdit et al 学术编辑

为科研文章而设的自动化语法检查 (上)

11分钟 ·
播放数16
·
评论数0

在今期的节目中, Trevor 访问了Writefull (Digital Science) 的首席应用语言学家 Hilde van Zeeland。立即收听以了解人工智能如何帮助您在撰写下一篇研究论文时检查学术英语

0:03

欢迎来到AsiaEdit et al

0:05

我们的播客给您带来

0:07

关于学术研究和发表文章的专家建议

0:10

我是主持人Trevor Lane

0:22

大家好, 今天我们邀请到的嘉宾是 Hilde van Zeeland博士, 她是Writefull的应用语言学家

Writefull是Digital Science旗下一款新的编辑软件, 它有免费版和付费版, 是 Microsoft Word和 Overleaf LaTeX上的一款插件。它是一个学术语法和拼写检查器,并运用了人工智能技术,接下来让我们来了解更多内容

0:49

您好 Hilde

0:50

欢迎来到我们的节目担任嘉宾

0:52

谢谢你们的邀请

0:55

首先,想问一下Writefull是如何创建的 为什么创建的?

除了常规的语法和拼写检查,它还有什么功能

1:04

Writefull是我和另外一位联合创始人在攻读博士学位时创建的

1:11

那时候 我们要写很多学术文章和论文

1:14

而我们的母语不是英语母语,于是我们遇到了困难,因此 我们认为一定有一种方法可以把语言和知识结合

我当时在攻读应用语言学和计算机科学博士学位,而这正是项目的联合创始人之一 Juan Castro的专长

1:32

于是 我们提出了Writefull,它最初使用语料库语言学,也就是关于语言使用的统计数据来帮助人们写作

1:41

它与常规语法检查器的区别,在于它关注的是研究语言,所以它是为科学语言提供量身定制的反馈

1:52

今天它给出的反馈是非常先进的,是基于人工智能的反馈,尤其在语言反馈方面

2:03

好的,我们将在稍后讨论人工智能的部分,作为一名应用语言学家,您认为学术英语和普通书面英语,在语言上有什么主要区别?英语学习者常犯的文体错误有哪些?

2:21

区别有很多

其中一个主要的不同是

2:25

词汇使用的频率

在一般英语和口语中

2:30

词汇的频率是相当高的

2:32

所以确实有很多常用词

2:37

而在学术写作中 词汇通常是

特定学科的、使用频率较低的词汇

2:43

也就是意思相同却不常见的词汇

我们还发现 短语动词

2:49

在学术写作中比在其他类型的

写作中要少见得多

2:54

这并不意味着我们不能用它们

2:56

但是有时候 比如“point out”

您可以在学术写作中用到

3:00

其他动词短语也会出现

但比日常英语的使用频率要小得多

3:04

英语学习者常见的一些错误

也与此有关 您有时

3:11

会在学术写作中

看到一些句子 听起来

3:15

有点不正式 或者您会看到

作者试图使用正式语言

3:21

读起来有点怪 尤其是

正式和非正式语言之间的混合

3:26

好的 例如 一个您不会在学术论文中

3:31

用到的、非正式动词短语的例子是

3:35

“put up with”而不是“tolerate”

3:38

是的 没错 这是一个很好的例子

3:41

如果将Writefull添加到Microsoft Word中

它是否易于使用?有哪些编辑功能?

3:50

它对Track Changes有用吗?

3:52

是的 它被添加到Word以后

就很容易使用了 它出现在上方横栏上

3:57

您可以选择检查整个文档 所有的语言

4:02

所有的段落 或者只是一小部分

或者只是文本的一个段落

4:07

然后您会看到右边的语言建议

4:10

有两种语言模式可供用户选择:

Proofread校对模式和Full Edit全编辑模式

4:15

Full Edit模式是我们最近推出的

一种更高级的语言模式

4:21

它超越了典型的语法检查

会检查使用的单词

4:26

单词的组合 句子的流动

它可以提供

4:30

完整的句子改写 这就是我之前

提到的更先进的人工智能部分

4:36

还有Track Changes 但这只在

Windows版本的Writefull中

4:40

因为Mac不支持Track Changes

4:44

那么 校对或编辑功能是否会

显示在文档中 然后用户要……

4:51

它会显示更改 然后用户必须接受

或拒绝每一个更改

4:55

就像Track Change Document一样?

4:58

还是它在不同的窗口显示

您可以选择接受或拒绝每一个更改?

5:04

是的  Track Changes

是和Check Track Changes一起运行的

5:08

您可以先稍等一会儿

然后在文本中接受

5:12

如果您使用两种模式中的一种

那么您可以在文档右侧的面板中看到建议

5:17

然后您基本上可以在那里

选择接受或拒绝

5:21

好的 除了校对和编辑功能

该软件是否还提供

5:28

其他的提示或对更正的解释?

5:34

不会 因为它…特别是Full Edit模式

使用了人工智能方法

5:40

它给出的建议基本上是非常自由的

所以它没有使用语法规则来给出说明

5:44

例如不会显示 "这就是您需要

添加冠词或逗号的地方 原因是……"

5:50

由于人工智能的运用 它不会说

"这就是我们进行这些编辑的原因"

5:55

所以这就是只使用人工智能和

"没有规则"的缺点 即您事先并不知道

6:01

工具将提供什么样的反馈

6:04

但是 对还不太熟悉英语学术写作的人

我们也提供了另外两个小工具

6:12

Language Search 和 Sentence Palate

6:15

Language Search是一个搜索框

用户可以使用它来查找单词和短语

6:20

看看它们在学术写作中

使用的频率和使用方式

6:25

Sentence Palate提供常见的短语和句子

可以在论文或论文的不�������部分使用

6:32

所以这些对用户来说确实有引导价值

6:38

好的 我也下载和试用了

6:42

Sentence Palate就像一本常用语手册

学术常用语手册

6:47

如果您去国外度假 短语手册

会帮你学一些有用的短语

6:51

虽然手册不是万能

6:54

用户必须慢慢适应它

但这是一个很好的开始

6:59

另一个功能就像

7:04

"语词检索"

它会找到单词或短语

7:08

然后给出例句

7:13

是的 您也可以加上下划线"_"

来表示什么词适合这个上下文

7:17

甚至 在单词前后加一个星号(*)

以查看单词的同义词

7:23

是否适合特定的上下文

所以它能帮助您想出其他表达的方式

7:29

好的 您可以说说软件的付费版本

和免费版本之间的主要区别吗?

7:35

好的 它们总体上非常相似

主要的区别在于 在付费版本

7:41

您可以获得更多内容 而免费版本

您可以得到有限的语言使用的建议

7:45

在Sentence Palate和Language Search

中得到有限的结果

7:50

对于高级会员 您基本上可以

看到所有的建议和所有的搜索结果

7:56

好的 Writefull是如何执行检查的呢?

必须要连网吗?

8:03

是在线实时检查吗?

要检查的文本是保密的吗?

8:09

是的 一切都是在线完成

文本是加密的 数据发送到服务器

8:13

处理数据 给出反馈

8:18

它再次被加密 然后反馈发送回来

8:21

您必须要连接互联网

但我们不存储任何文本、

8:26

建议、被接受或拒绝的建议

当然 我们经常会遇到这样的问题

8:33

因为很多数据都是高度机密的

有些还是没有发表的稿件

8:39

我们非常清楚这一点

我们确实非常小心地处理

8:43

好的 这一点很好 您会针对

8:47

用户的使用来分析什么类型的信息呢?

8:52

我们分析的只是用户

8:56

登录频率的基本活动

8:58

他们使用的频率或时间通常是多少

他们会用几天几个星期

9:05

因为我们需要知道活跃用户有哪些

9:09

用户喜欢我们软件的哪些地方

这就是我们要存储的信息

9:14

好的 这个软件包括内容抄袭检测

文本匹配筛选吗?

9:20

没有 它只是语言支持工具

9:23

市场上已经有许多其他工具

向用户提供这一功能

9:28

我们有一个叫Writefull Cite的服务

它会处理文本中的所有句子

9:37

并运用了人工智能 我们有自己的

模型来评估句子是否含有引用

9:44

是否应该包含引用 在这个句子中

是否有一些信息需要来源的支持

9:50

而且它不使用另一个文本数据库

所以 它实际上只关注句子本身

9:58

这就是Writefull Cite 它与带有

语言检查的Writefull是分开的

10:02

我们提供这种服务 但仅限于机构

10:06

挺有意思的

10:08

关于人工智能 Writefull是如何

被人工智能训练的?您说

10:17

它是根据频率 而不是编程的

语法规则来判断的

10:21

是的 基本上它不一定是

原始频率计数 而基本上是

10:28

通过处理这些稿件中的句子来学习的

10:32

当一个句子不符合它看到的模式时

它可以识别出来

10:36

它没有语法规则 因为语法规则……

10:41

那是没完没了的 因为仅仅有

语法规则 是不可能达到

10:47

在人类写作中 语言实现上

所有的方式 这是不可能的

10:52

而且是的 它是完全通过

人工智能来学习的