耕读频道 - 耕读频道 @igengdu | 耕读博客 igengdu.com

耕读频道 @igengdu | 耕读博客 igengdu.com

11:44 · 2025年4月3日 · 周四

#AI #NotebookLM #谷歌 #教育 #消息

消息：谷歌NotebookLM推出发现信息源功能

简介：谷歌NotebookLM宗旨在于：帮助人理解万物。自今日起，谷歌NotebookLM在原有的用户上传信息源功能之外，推出了发现信息源（Discover sources）功能。

目前，发现信息源Discover sources分为AI自动推送话题和用户提交话题两种模式，根据用户提交的主题或AI随机推送的主题，谷歌NotebookLM会查找并给出仅限10条信息源。

说明：对于搞学术研究的人而言，谷歌NotebookLM推出的发现信息源功能是一件可以期待的、梳理资料的辅助工具；谷歌NotebookLM不仅可以将故事生成为音频，还可以在深入探究对话模式（Deep Dive conversation）中，将根据文本以对话的形式（Two hosts）来展现核心内容，可以帮助我们通过音频的形式、或对话的形式来理解某个需要深入思考的主题。

📢 频道 ✈️ 群组 (耕读) 📬 投稿

AI NotebookLM 谷歌教育消息

10:39 · 2025年1月6日 · 周一

#AI #学术工具 #NotebookLM #Deep Research #STORM #NotebookLlama #推荐

耕读—SumeAI分享三款AI学术工具

1.NotebookLM
NotebookLM为谷歌的产品，宣称是”理解你最重要信息的最终工具；你定制化的AI研究工具“等；支持上传PDF、网址、YouTube视频、音频文件或谷歌文档的内容。
特征：（当前）基于Gemini 2.0对内容进行摘要，获取内容之间的关联；可以生成音频文件（开源方案可在Whatsapp等软件使用Meta的NotebookLlama 或本地部署 Podcastfy）。
网址： https://notebooklm.google.com/

2.Deep Research
Deep Research也是谷歌的产品（具体而言，是DeepMind的产品），Deep Research定位为个人AI研究助手，主要使用AI探究复杂的话题，并找出数据之间的关联，并以综合、易读的方式呈现出来。参见视频文件。
特征：需要Google Advanced服务，才可以选择Google Deep Research。
网址： https://gemini.google/advanced/
替代方案：使用谷歌的 https://aistudio.google.com/ 在选好模型之后，设置好作为学术领域研究专家等提示词（Prompts）即可（如何写好AI提示词？——AI提示词中文指南）。

3.STORM
STORM模型现在包括两种：STORM和Co-STORM；STORM是斯坦福大学于2024年2月推出，侧重于模拟专业学者或经验丰富的记者能够从多角度、多维度多问题进行分析、并形成文章；而Co-STORM于2024年8月推出，在STORM模型基础上，引入多智能体，用户可以随时参与、调整，能够有效地深化思考的多角度、多维度等（图三），具体参考官网说明。

仓库地址： https://github.com/stanford-oval/storm
体验网址： https://storm.genie.stanford.edu/
说明：需要谷歌账号登录，目前仅支持英文输入、输出。

参考：源1

📢 频道 ✈️ 群组 (耕读) 📬 投稿

0:49

Media is too big

VIEW IN TELEGRAM

AI 学术工具 NotebookLM Deep STORM NotebookLlama 推荐

12:47 · 2024年12月22日 · 周日

#AI #Genspark #AI多模型聚合服务 #活动

分享一个AI模型聚合服务Genspark

具体内容：Genspark是一个位于新加坡的初创公司，专注于提供聚合多个AI模型的服务，包括文本对话、图像生成、探索服务等方面的多AI模型服务。

昨日开始，Genspark官方在搞活动，受邀注册（双方）即可获得一个月专业服务。目前Genspark注册即可食用ChatGPT-4o、ChatGPT- o1、 Claude 3.5 Sonnet、Geminie 1.5 pro等。

官方地址： https://www.genspark.ai/ 我的邀请链接：点击这里。

活动说明：经邀请码注册，你我皆可获得一个月专业版服务；活动对象仅限12月1日之后的注册者（建议注册一个新的账号）；分享邀请者最多可获得20个月专业版服务。

消息来源：Genspark X账号消息。

📢 频道 ✈️ 群组 (耕读) 📬 投稿

AI Genspark AI多模型聚合服务活动

10:26 · 2024年12月2日 · 周一

#AI #辅助编程 #风口 #推荐

从零基础AI编程大获成功想到的

近期让人感触的事情：零基础、AI写APP，拿下AppStore同类产品付费榜第一（来源：这里）。

作者（AI进化论花生）从美团“用户研究和运营”岗位辞职，编程几乎零基础（学了点Python），通过AI（前期是ChatGPT，但主要是指Cursor+Claude sonnet）学习编程，通过媒体资源发觉需求、发布产品等，最终顺利地踏上了人工智能（AI）这趟风口。花生自己的介绍页是这样写的：“作为一个经济学背景，在美团/阿里等大厂做了10年用户研究/产品运营工作，完全不会写代码的人。在AI的加持下，我2个多月就上架了10+款AI产品。”

感想：1.AI确实降低了编程的门槛。对于编程有志趣的人，确实可以借助AI，快速地实践、学习一门编程语言或通过制作一个项目来学习、实践编程。2.或许，AI的介入，也变相地推升了好的编程、运维实践的难度。3.花生大佬确实会运营，值得学习。

说明：花生大佬在B站和油管（YouTube）分享了用AI学习编程的视频资源（部分资源需要付费，读者朋友可以自己斟酌），值得想用AI学习编程的朋友观看。

详细内容，参见智汇AI的文章：从零基础AI编程大获成功想到的；

参见：AI给编程带来的机遇与挑战 (Follow RSS订阅器的读者朋友，可以Boost 本订阅 https://www.igdux.com/feed )

📢 频道 ✈️ 群组 (耕读) 📬 投稿

AI 辅助编程风口推荐

09:38 · 2024年9月20日 · 周五

#AI #Google #VEO #Youtube #标记 #AI生成的内容 #分享

1.谷歌公司在Youtube短视频中引入Veo模型，允许创作者制作6秒的短视频，将其与现有的视频结合，扩展视觉效果。

据悉，Veo的AI技术将集成到YouTube Shorts 的 Dream Screen 功能中。Dream Screen 首先使用 Imagen 3 生成四个不同的图像，创作者可以从这些选项中选择符合他们偏好风格、构图或美学的图像；在选择图像后，Veo模型将基于所选图像生成6秒长的高质量背景视频，以实现用户的创意愿景。

2.于此同时，Google官方博客宣布，将会在今年晚些时候标记AI生成和编辑的图像，甚至考虑在Youtube视频中加入AI内容生成标记。

Google标记AI内容的标准，依据靠行业组织 Coalition for Content Provenance and Authenticity (C2PA)的元数据标。

参考：这里。

📢 频道 ✈️ 群聊 (耕读) 📬 投稿

AI Google VEO Youtube 标记 AI生成的内容分享

09:22 · 2024年9月20日 · 周五

#AI #OpenAI #o1 #观点 #分享

在2024年9月18日（美西时间） T-Mobile Capital Markets Day 上，OpenAI CEO 山姆·奥特曼（Sam Altman ）参加访谈（访谈连接，视频中的50分～1小时05分37秒，之后是黄仁勋接受访谈）

山姆·奥特曼（Sam Altman ）其访谈内容可以总结出以下几个要点：

1.OpenAI 新发布的推理模型 o1 preview 相当于 GPT-2 时刻，但是升级曲线会很陡峭，意味着很快就会达到它的 GPT-4 时刻。

2.推理模型这种新范式的一个最大特点就是升级速度极快。因此，现在模型无法解决的问题，过几个月它们就能解决。而最重要的是，我们将看到一些全新的模型使用方式。

3.在 o1 的研发早期阶段，将会有全新的使用方式，这些不仅仅是聊天界面。我们需要一段时间来构建这些新方式，其他人也需要时间来适应。用户也需要一段时间来学习如何使用它。这与 GPT 模型有很大的不同。

4.AI的五个发展阶段。第一个阶段是聊天机器人。第二个阶段，也就是我们现在刚刚达到的，是推理系统。第三阶段是 AI 智能体。第四阶段是创新者，具有发现新科学信息的能力。第五阶段是完整的组织。从第一阶段过渡到第二阶段花费了一段时间，第二阶段能相对较快地推动第三阶段 AI 智能体的发展。

5.OpenAI 不会用 API 调用的数据后者训练的数据来训练他们的模型

6.OpenAI 成功的秘诀是因为有坚定的信念和保持专注，能保持研究方向的聚焦。坚信深度学习的力量，相信可以从现有的状态一路走到通用人工智能（AGI）甚至更远，尽最大努力做得最好，并试图保持研究方向的聚焦。与此同时，会根据前进过程中学到的新知识来调整方向。尽全力去完成每一个任务，随着时间的推移，就能产生积累效应。

7.看好未来 AI 在医疗保健领域、教育领域和科学研究领域上的贡献。

来源：宝玉分享。

📢 频道 ✈️ 群聊 (耕读) 📬 投稿

AI OpenAI o1 观点分享

20:59 · 2024年8月27日 · 周二

#陶哲轩 #数学 #AI #辅助 #CoT

分享一个视频：https://www.youtube.com/watch?v=e049IoFBnLA

B站地址：

https://bilibili.com/video/BV1kssseFE6X

视频内容为：陶哲轩（美籍华人，数学界最高荣誉、菲尔兹奖获得者）在IMO 2024暨65界国际数学奥林匹亚会议上的演讲

主要内容：

1. 我们使用机器做数学计算已经有数千年，最早的机器辅助计算可能是罗马人，然后是中国的算盘

2. 二战时就有人肉“计算机”，计算弹道和其他任务，多位女孩子，因为男士们在打仗，所以那时候的计算基本单位不是GPU，而是kilogirl-hour——“千名女孩工作一小时的计算量”

3. 现在，数学家们使用一种现代化的证明辅助编程语言，叫做 Lean。在 Lean 中有一个核心的数学库，通过众包的方式开发的，本科数学课程中看到的内容，比如微积分基础、群论基础或者拓扑学等等，这些都已经被形式化了，所以你不用从公理开始。

4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程，那就是先编写一个称为“蓝图”的详细证明计划，将整个证明分解为数百个小步骤。每个步骤可以单独形式化，然后再将它们整合在一起，这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图，然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。

去年，陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了，使用了蓝图工具，参与的人中有概率论专家，甚至还有一些并非数学家的人，他们是程序员，但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务，并完成了它。

在数学领域，通常很难这么多人一起合作，一般最多可能五个人合作。因为在大项目上合作时，你必须相信每个人的数学都是正确的。但是，一旦超过一定规模，这就无法实现了。但现在借助 Lean 编译器，它能自动检查。团队成员无法上传任何编译不通过的内容，会被拒绝。因此，你可以与一些从未见过的人合作。

5.最后是讲大语言模型，首先陶哲轩就打脸了 GPT-4 的论文（我猜是微软那篇《GPT-4，通用人工智能的火花》），论文中号称 GPT-4 能解决国际数学奥林匹克问题，但实际上，这个问题不是 2022 年国际奥数竞赛的原始问题，而是一个简化版本，并且他们测试了几百道国际奥数竞赛问题，成功率只有1%，论文里的这个是精心挑选的恰巧能做对的。

6.陶哲轩提到了基于大语言模型的一些改进的方案：

比如 CoT（Chain of Thought），也就是 LLM 做简单的算术运算都做不对，但是如果让它一步步解释，可能就对了。还可以教 AI 一些解题技巧，比如尝试简单的例子，反证法，尝试逐步证明等。

比如让模型和编程语言或者工具连接，将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证，并且迭代的进行修正和验证，直到得到正确的结果，这可以提升大语言模型生成的效果。

即使借助这些手段，大语言模型还远远不能解决大多数数学问题，更不用说数学研究问题了！

7.当然陶哲轩也没太过打击大家对于 AI 的信心，表示我们在 AI 上还是在不断的取得进展，还提到了他日常是怎么用 AI 的，比如说把 AI 当成灵感之源。

> 我曾遇到过一个问题，我尝试了几种方法，但都无法解决。于是，我尝试询问 GPT，你建议我使用什么其他方法来解决这个问题？GPT 给我提供了 10 种可能的方法，其中有 5 种我已经尝试过，或者明显没有帮助。的确，有几种方法并不实用。但其中有一种我还没尝试过的方法，那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时，我意识到这就是我漏掉的正确方法。所以，将 GPT 视为一个交流伙伴，它确实具有一定的用处。

还有使用 GitHub Copilot 帮他写代码，让它自动生成下一步的证明结果，Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。

> 例如我使用的一个叫 GitHub Copilot 的工具，你只需要写下一半的证明，它就会尝试猜测接下来的内容。大概有 20% 的情况下，它能猜到接近正确的答案。然后你就可以说，我接受这个答案。好的，那么在这种情况下，我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行，尽管你可能看不清楚，却真的解决了这个问题。所以，你不能盲目接受它的输入，因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解，这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行，它们就能自动完成。现在已经有了这样的实验，即通过迭代地让 AI 提供证明，然后让编译器进行反馈，如果编译出错，就把错误信息反馈给 AI。通过这种方法，我们开始能够验证四五步长的证明。当然，一个大型的证明可能需要数万行。所以，我们还没有达到能够立即得到一个正式证明的程度。但是，这已经是一个相当有用的工具。

8.对于大家关心的问题： AI 在数学领域现在到了哪一个阶段？是否未来几年利用 AI 能直接解决数学问题？

陶哲轩也给出了他的看法：
> 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题，你可以定制专门的 AI 来处理一小部分问题。即便如此，它们也不是完全可靠的，但还是有用的。不过至少在接下来的几年里，它们基本上将是非常有用的辅助工具，超越了我们已经熟悉的暴力计算辅助。

他还提到了一些可能的 AI 能在数学领域提供帮助的方向：
- AI 能够非常好地生成有价值的猜想

> 比如，我们已经看到了关于结理论的例子，它们已经可以推测出两个不同的统计量之间的关系。因此，我们希望能够创建大量的数据集，输入到 AI 中，它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点，部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。

- 批量或者说规模化的证明大量数学定理

> 现在，因为证明定理是如此繁琐和艰难的过程，我们一次只能证明一个定理，如果你效率很高，可能一次能证明两三个。但是有了 AI，你可以设想一下未来的情况，我们不是试图解决一个问题，而是处理一类类似的1000个问题，然后告诉AI，尝试用这个方法解决这 1000 个问题，然后报告结果，哦，我能用这种技术解决 35% 的问题。那么另一种技术呢？我能解决这个百分比的问题。或者如果结合这些方法，又能解决多少问题？你可以开始探索问题的空间，而不是一个接一个地解决问题。这是你现在根本无法做到的事情，或者是你需要几十年时间，通过数十篇论文慢慢搞清楚各种技术能做什么，不能做什么。但是有了这些工具，你真的可以开始做规模前所未有的数学研究。所以，未来将会非常令人兴奋。

9.演讲环节结束前的最后一句话说的特别好：
> 我们仍然会以传统方式证明定理。事实上，我们必须这样做，因为如果我们自己都不知道如何做这些事情，就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。

这恰恰也是我们现在使用 AI 辅助编程的问题：如果我们自己都不知道如何构建软件，就很难引导好 AI 帮助我们生成高质量的代码。

尽管 AI 在数学和编程领域变得越来越有用，但人类的洞察力和创造力仍然是创作价值的关键。

总结的内容源自宝玉大佬的总结。

📢 频道 ✈️ 群聊 (耕读) 📬 投稿

陶哲轩数学 AI 辅助 CoT

10:09 · 2024年7月1日 · 周一

#AIGC #AI #微软 #Microsoft #入门 #教程 #分享

在人工智能（AI）时代，或许是为了试图通过适应或引领AI潮流，让公司更值钱、走得更远，微软的反应速度之快和对AI的支持力度都是世所罕见。

对于AI的支持，不仅表现为微软是OpenAI的金主(匿名董事)，还表现为通过ChatGPT全面改造微软产品，如(New Bing)Copilot，Win 11加入人工智能服务等，还表现为近日开源的“生产式人工智能初学者入门教程（Generative AI for Beginners）”。该系列教程，包括18节课，内容包含“生产式AI介绍，生产式AI与大语言模型比较，可靠地使用生产式AI，提示词工程，搭建文本生成，搭建聊天应用，搭建探索应用矢量数据库，搭建图形生成应用，搭建低代码AI应用，集成外部应用程序和函数调用，人工智能应用的用户体验设计，保护生成式AI应用安全，生成式人工智能应用生命周期，检索增强生成(RAG)与矢量数据库，开源模型与Huggingface，AI代理人，微调大语言模型”等等。

目前该课程在Github上拥有5万+点赞。可见该课程的受欢迎程度。如果你想紧跟AI时代潮流，这门课程值得你认真学习。推荐。

网址：https://microsoft.github.io/generative-ai-for-beginners/#/

📢 频道 ✈️ 群聊 (耕读) 📬 投稿

AIGC AI 微软 Microsoft 入门教程分享

16:45 · 2024年6月16日 · 周日

#Youtuber #知识分享 #探索引擎 #AI #分享 #推荐

今天给大家推荐一位Youtuber：檀东东·Tango ，主要专注于知识分享，包括探索引擎、问题分析、AI使用等。

我最早认识檀东东这位Youtuber，是通过读者朋友分享檀东东的视频：搜索技术，普通人变强的唯一外挂。全套详细宝藏教程~ 。当时我正在写查找目标信息系列的文章（目前该系列只出了两篇：何谓信息？信息的本质与基本运行法则是什么？和信息化和人工智能时代，我们应该如何找到目标信息？），该视频分享的内容，我比较熟悉，观看完之后发现，其分享的内容比较全面、真实有效、逻辑清晰，看了之后，受益良多，之前频道里简要分享过(点击查看)。

檀东东的Youtube频道，最早是做Mindmanager思维导图教程等，后来做学习、工作思维方法类的分享，近期做探索引擎、AI类的知识分享，还包括生活类的视频分享。目前该频道发了131个视频，订阅数有16.9万人。

推荐的视频：
1.ChatGPT 是少数强者的【外挂】｜ChatGPT使用教程

2.搜索技术，普通人变强的唯一外挂。全套详细宝藏教程~

3.ChatGPT说：和我对话，能上清华｜彻底颠覆教育，拉开差距

4.想做视频博主？这个视频得看，帮你无障碍启动（建议你也成为Youtuber，100万点击量=5万美金收入）

5.『费曼学习法』这是最牛的学习方法，教是最好的学！教是最好的学

6.2023年，我的成长秘诀，都在这4个模型里

7.【结构化思考】因为平庸，我才努力点满这项奇技

📢 频道 ✈️ 群聊 (耕读) 📬 投稿

Youtuber 知识分享探索引擎 AI 分享推荐

21:28 · 2024年5月7日 · 周二

#AI #学习 #免费 #国产

简介：Elmo，一款国人（原阿里巴巴技术副总裁贾扬清创立的 Lepton AI 团队）开发的、基于开源大模型LLM的、开箱即用无需登录的 AI Chrome 拓展，可以总结PDF、Youtube视频内容、翻译网页文档等的AI工具。

特点：

- 快速总结网页内容并生成要点，适合需要快速获取信息或者大致了解主题的用户；
- 针对当前网页内容提出问题并获取答案，节省搜索资料所花费的时间和精力；
- 无需离开当前页面，从网络上抓取与关键词相关的信息并无缝融入到你的浏览体验中；
- 把 PDF 或者 YouTube 当成 Chatbot 一样进行提问对话，让你在处理大量文本或者理解晦涩视频时更加轻松；
- 除此之外，Elmo 还支持翻译、改写等功能。

网址：Web | Chrome Web Store

参考@Humanitech

📢 频道 ✈️ 群聊 (耕读) 📬 投稿

AI 学习免费国产