计算机教程网

您现在的位置是:首页 > 智能时代 > 人工智能

人工智能

一只暹罗猫竟是论文作者!谷歌学术 20 岁,创始人首次公开最魔幻学术故事

2024-11-24 07:44:20人工智能 IT之家
今年是谷歌学术创立 20 周年,创始人们特意为此撰写了一篇博客,回顾了谷歌学术的成长历程,并分享了一些实用的使用技巧和背后的趣闻轶事。在 AI 浪潮席卷而来之际,谷歌学术将如何站稳脚跟?

今年是谷歌学术创立 20 周年,创始人们特意为此撰写了一篇博客,回顾了谷歌学术的成长历程,并分享了一些实用的使用技巧和背后的趣闻轶事。在 AI 浪潮席卷而来之际,谷歌学术将如何站稳脚跟?

全球最大、最全面的学术搜索引擎,非谷歌学术(Google Scholar)莫属。

根据网络流量测量工具 Similarweb 的数据,谷歌学术每月的访问量超过 1 亿次。

今年是它创立 20 周年,两位创始人 Alex Verstak 和 Anurag Acharya 特地为此撰写了一篇博客。

博客地址:https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

博客中贴心地包含了 Scholar 的使用指南,还提到了不少轶闻趣事。

先让我们来看看两位创始人为我们提供了哪些 Scholar 的使用建议吧 ——

使用 tips

1. 使用 AI 提纲高效阅读论文

最近,谷歌学术搜索的 PDF 阅读器新增了 AI 提纲功能。

AI 提纲是一种论文的扩展目录,为每个关键部分提供几条要点。浏览提纲即可快速了解论文概况。

点击某条要点即可深入阅读感兴趣的内容。

除了 AI 提纲,Scholar 的 PDF 阅读器还提供了许多功能以帮助你更快阅读:一键预览被引文献、链接的图表和表格引用、引用和相关文献、以及明暗模式切换。

2. 通过「Case law」解锁法律资源

获取法律文件往往是一件困难的事,它们并不容易访问。但谷歌学术搜索拥有全面的案例法合集,任何人都可以搜索。

只需在侧栏选择「Case law」,输入查询即可解锁海量的法律资源。

3. 轻松复制现成的文章引用格式

你无需手动格式化参考文献。点击「Cite」按钮,谷歌学术搜索即可提供多种格式的现成引用。只需选择所需的格式并直接使用。

4. 创建你自己的论文图书馆

在谷歌学术搜索,你只需点击一下即可将文章保存到个人图书馆。

在图书馆中,你可以通过创建自定义标签对收藏的论文进行分类,结构化地组织内容,还能按论文的发表时间进行分组访问。

5. 关注特定作者

在快节奏的学术界,紧跟前沿信息至关重要。在谷歌学术搜索上,你可以关注特定作者,每当他们发表新作品时都会收到邮件提醒。此功能帮助用户实时掌握感兴趣领域的最新研究动态。

AI 浪潮中如何幸存?

近年来,利用 AI 提升学术搜索体验的竞争者纷纷登场,让学术界的搜索方式变得更加多样化。

「谷歌学术对科学的影响是显著的,」美国西雅图华盛顿大学的计算社会科学家 Jevin West 说道,他几乎每天都在使用谷歌学术。

但他也坦言,「如果说谷歌学术有可能被取代的话,也许就是现在,因为其他产品的创新正在涌现。」

例如,ChatGPT 已经成为一些科学家进行文献搜索、审查和总结的首选工具。

Semantic Scholar,生成简洁明了的论文摘要,并识别最相关的引用文献,让用户迅速掌握文章核心。

依托 Semantic Scholar 数据库的 Consensus,则通过 AI 从多篇文献中提炼和整合信息,精准回答用户提出的具体的研究问题。

还有 Undermind,引入「基于代理」的搜索模式,它模拟人类阅读文献的过程,动态调整查询策略,返回更加精准和个性化的结果,颠覆了传统的搜索体验。

针对谷歌学术数据来源不透明、无法全面公开索引内容以及限制批量下载等问题,开放学术数据库 OpenAlex 于 2022 年推出。它完全基于开源数据,透明度高,用户可以免费下载其所有记录,非常适合做计量学分析和大规模数据研究。

尽管如此,谷歌学术的联创 Anurag Acharya 并不把这些新兴工具视作竞争对手。

他表示,任何能让学术信息更容易获取的尝试都值得鼓励,大家做得越多,对科学进步就越有益。

Acharya 还提到,谷歌学术也在积极拥抱 AI,利用它对文章进行智能排名、推荐相关搜索查询,以及推荐相关文章。

而且,谷歌学术最近还为 PDF 阅读器引入了 AI 生成的文章大纲,进一步提升了用户的阅读体验。

他解释道,谷歌学术的搜索工具也在努力理解查询背后的意图和上下文,采用的语义搜索方法基于语言模型,已经运行了大约两年。

不过,谷歌学术目前还没有像普通谷歌搜索那样为查询提供 AI 生成的简洁答案概述。

Acharya 认为,汇总多篇论文的结论,并确保既简洁又包含重要背景信息,仍是个不小的挑战。

「至今我们还没有找到有效的解决方案。」他说。

由来

在以前,获取学术信息非常困难,且常常受限于付费墙。研究人员要么通过图书馆寻找信息,要么通过访问收费的在线服务(如科学引文数据库 Web of Science)查找学术论文。

2004 年,Alex Verstak 和 Anurag Acharya 希望能打破这一困境,让研究人员能够找到并阅读感兴趣的研究成果。

经过九个月的开发,谷歌学术搜索诞生了。

在这里,动手一搜,你可以轻松地找到在线学术期刊、书籍、会议论文、学位论文、预印本、摘要、技术报告及其他研究成果…… 涵盖多种语言,来自世界各地。

最重要的是,它们很多都是免费的。

早期,由于网络速度慢且不稳定,收集研究资料、丰富这个在线图书馆的馆藏,是一件极为困难的事情。

为了解决这一问题,团队采用了一种「低技术」方案,称为「Sneakernet」——

出版商将文章加载到物理硬盘上,两位创始人每天上班路上会亲自去取这些硬盘。

可以说,早期的谷歌学术搜索是他们靠脚踏实地「跑腿」跑出来的!

这也力证了他们的初心:帮助全世界的研究人员轻松地「站在巨人的肩膀上」,能够看得更远。

轶闻趣事

在博客里,两位创始人还讲了不少在谷歌学术搜索发生的趣事~

在谷歌学术中,有许多以各种别致风格写成的法律文件。

有一份法律意见是以一系列歌曲的形式写成的,还标注要唱成 LeAnn Rimes 的曲调。

还有用诗歌开头的意见书。

除了这些有趣的法律文件,还有几篇物理学论文也很爱玩。

在「Can apparent superluminal neutrino speeds be explained as a quantum weak measurement?」(表面上超光速的中微子速度是否可以用量子弱测量来解释?)的题目下,它的摘要只有两个词:「Probably not」(可能不行)。

物理学界,还有一只暹罗猫 F.D.C. Willard(又名 Chester)作为共同作者出现在一篇论文中,做出了它的「喵」力贡献。

该论文研究了固态氦-3 的磁性,以及原子之间的相互作用在极低温下如何影响其行为。

Chester 之所以成为作者,是因为他的共同作者兼主人 Jack H. Hetherington 在完稿后才发现,整篇论文的表述过程中他都使用了第一人称的复数「we」,没有用单数「I」。而期刊会拒绝接受单一作者使用这种写法的投稿。

Hetherington 懒得将文章里的「we」改成「I」,就干脆把家里猫咪的名字给署上了。

此外,还有一篇很有趣的论文,关于希格斯玻色子测量的。

它的作者人数超过 5000 人,正文 9 页,而鸣谢名单足足 24 页。

窥一斑而知全豹

两位创始人在博客里写道,在谷歌学术搜索的二十年里,他们还没见过团队规模如此庞大的研究成果。

有些科学发现确实需要「全村的努力」。

有趣的是,这些论文都来自物理学界。

参考资料:

  • https://blog.google/outreach-initiatives/education/google-scholar-20-years/#early-days

  • https://www.nature.com/articles/d41586-024-03746-y

本文来自微信公众号:微信公众号(ID:null),作者:新智元