我们为什么做文枢学术
作者回顾了大学期间处理大量学术论文的经历,从最初依赖传统方法如Zotero和翻译工具,到后来利用AI辅助阅读。然而,现有AI工具虽提升效率,却可能削弱独立思考,因为它们预设重点,限制了学者自主分析。为此,作者与朋友开发了文枢学术,旨在平衡效率与批判性思维。该工具提供双语内容、结构化重整(如思维导图和精读目录),保留专业术语并优化阅读体验,同时支持图表和公式的准确呈现。它帮助用户在短时间内高效阅读文献,而不牺牲深度理解,未来将继续完善,打造一站式论文阅读工作流。
回想起来,现在距离我第一次踏入大学的校门已然过去三年多。期间课程论文写了无数,Zotero入库的文献数量竟逼近600篇。
那个时候AI对高等教育的冲击才刚刚崭露头角,香港大部分高校都是严格禁止在任何情况下使用AI的。而我自诩是个老派人,所以不屑一顾地选择了最专业,或者传统的论文写作方法。
我用Google Scholar找文章,扫一眼Abstract之后下载到Zotero。在Zotero中,我可以方便地标注或者复制一些语句,作为写作时的支撑;对于一些需要深度参考的文章,我甚至有打印出来用荧光笔划线的癖好。
实话说,在现在的我看来这种做法有些附庸风雅了。香港课业压力很重,几乎每节课都需要写一篇结课论文。也就是说每个学期我都有五篇论文要写,这逼迫我进行着高强度的阅读。好在论文篇幅不长,平均每篇论文大概需要从泛读的大约20篇文献中挑选出合适的7-8篇文献引用。那么一年需要阅读的文献也近200篇了。
我需要更加有效率的阅读方法,尤其是作为一个非英语母语者。
通常来说,英译中是一个最简单的选项。它允许你在保留全部原文内容的情况下,能够以母语阅读的速度完成整篇文献的泛读,而且这是完全免费的。我想在前AI时代也有很多学生这么做:用谷歌翻译将整篇文献翻译成自己的母语。
不过这还是有些问题的。一是完全的翻译使得很多学术词汇变得词不达意,而且也错失了很多接触和熟悉这些术语的机会。往往在泛读后还是需要回到英文原文找到相应的句子,才能准确地了解作者的意图;不过,翻译确实加速了文献筛选的过程。另一个不尽如人意的点是原文的结构:即便有学术素养的人大多都认同一个严谨的写作需要好的铺垫与段落衔接,但说实话它们并不那么适合阅读。我常常发现自己在字里行间寻找关键的陈述或者链接起数据与结论的丝线。
那么这就要说到AI了。在AI刚刚出现的时候,它呈现的方式主要还是对话框。有的学生会直接把论文题目丢给AI,但自认为是严谨学者的我是绝对不喜欢这么做的。不过我还是需要它,所以我较为保守地让AI对我提供的论文PDF进行总结,再适当地提一些问题来检验这篇文章是否是我想要的。由于AI是对全文进行总结,这比文章Abstract提供了更多的信息,尤其当你想要的信息不只是作者想表达的东西时。
我们都学过这样一些论文阅读方法,至少刷雅思题的时候“见过猪跑”。有时候你需要参考文章的研究方法,有时候你需要一些关键概念的定义,或者让这篇文章告诉你这些信息在哪里能够找到。那么总结下来,这个时候的阅读流程变成了:阅读摘要->与AI讨论文献细节->阅读论文翻译->阅读原文->做标注以用于写作。
很幸运,这套工作流支撑了我两年,让我在香港获得了足以升学的绩点,以及能让我在深圳逍遥一段时间的奖学金。
毕业一年后,我重新回到大学校园,惊觉AI在论文阅读的方向上已经有了极大的进步。它已经极大地远离了以前对话式的交互,走向更原生的应用体验了。有的应用延续了PDF阅读器的样式,不过自动地标注了一些高亮与笔记(像是自动化的Zotero);有的应用则将论文的不同维度拆解出来,分别做了简要的概括,方便跨论文对比。
但是仔细想,它们并没有解决很多阅读的问题,反而像是自以为是地告诉你什么是重要的,什么不是。如果一个软件自作主张地给你标注了重点,那么要么你会忽略掉其他可能的重点(这视乎你的研究问题而定),要么是无意义的(如果你花时间看完了全文,那么节省的这一点划线、总结的时间是微不足道的)。
作为学者,我们存在的意义就是用自己的视角看待他人的研究,最终得出合乎情理的结论。就算是一个正在完成课程作业的本科生,这也是不可避免的。如果一味的参考AI给出的总结,那么其实与直接照抄AI是没有区别的——因为这个学生既没有从阅读中学到东西,也没有获得进一步的思考。
就在这个时候,我的好朋友xy3给我介绍了他的demo,这最终成为了今天的文枢学术。我发现这个项目能够将我一直抱持的理念具象化:效率不应以牺牲独立思考为代价。
文枢学术提供双语的纯文本化的内容,这适配了各种大小的屏幕。对于需要快速泛读的需求,它提供了思维导图和精读目录,方便快速理解文章脉络,决定阅读重点。
不止如此,文枢学术以一种新颖的方式提供了论文内容:结构化重整。我们希望把论文“无损压缩”成一个看得懂的、可以快速查找的结构,同时又尽可能保留原文的内容。基础的解析模板涵盖了常见的背景、前置知识、方法、试验设置、实验结果与结论。重点是,分级的内容结构+要点式的段落内容可以让你一眼定位想看的知识,并在链接文章逻辑脉络的时候如鱼得水。
这套系统的优势在于,对比翻译保留了专业术语,又将结构整理为方便阅读的形式。
考虑到图表与公式在论文中的重要性,文枢学术还特别做了相应的适配。目前任何在论文中以图片形式呈现的内容我们都会用多模态模型结合上下文分析,支撑文章观点。对于理工科和经济学学者,公式的准确性是底线。我们不仅支持LaTeX级别的公式渲染,更保证公式在各种排版中不乱序。
这套系统目前已经完全能够替换我之前的阅读流程。在上个学期的课程作业中,我在一天内完成了15篇文献的阅读,支撑了一篇2000字论文的理论基础。
当然,作为文枢学术最深度的用户,我们还在不断打磨这个产品。在未来的规划中,我们将持续完善精读和阅读体验,努力打造一站式的论文阅读工作流。
欢迎大家来用文枢学术