耕读频道 @igengdu | 耕读博客 igengdu.com
#陶哲轩 #数学 #AI #辅助 #CoT

分享一个视频:https://www.youtube.com/watch?v=e049IoFBnLA

B站地址:

https://bilibili.com/video/BV1kssseFE6X

视频内容为:陶哲轩(美籍华人,数学界最高荣誉、菲尔兹奖获得者)在IMO 2024暨65界国际数学奥林匹亚会议上的演讲

主要内容:

1. 我们使用机器做数学计算已经有数千年,最早的机器辅助计算可能是罗马人,然后是中国的算盘

2. 二战时就有人肉“计算机”,计算弹道和其他任务,多位女孩子,因为男士们在打仗,所以那时候的计算基本单位不是GPU,而是kilogirl-hour——“千名女孩工作一小时的计算量”

3. 现在,数学家们使用一种现代化的证明辅助编程语言,叫做 Lean。在 Lean 中有一个核心的数学库,通过众包的方式开发的,本科数学课程中看到的内容,比如微积分基础、群论基础或者拓扑学等等,这些都已经被形式化了,所以你不用从公理开始。

4. 现在数学领域有一种团队协作证明复杂数学定理的工作流程,那就是先编写一个称为“蓝图”的详细证明计划,将整个证明分解为数百个小步骤。每个步骤可以单独形式化,然后再将它们整合在一起,这样你就可以将一个庞大的论证分解成许多小块。先编写这个蓝图,然后团队中的其他人可以对论据的不同步骤的不同部分进行形式化。

去年,陶哲轩和几位同事一起解决了一个组合数学问题。这是一个组合学的问题。大约20人在短短三周内完成了,使用了蓝图工具,参与的人中有概率论专家,甚至还有一些并非数学家的人,他们是程序员,但在解决这些小型拼图问题上非常擅长。每个人都挑选了一个觉得自己能做的小任务,并完成了它。

在数学领域,通常很难这么多人一起合作,一般最多可能五个人合作。因为在大项目上合作时,你必须相信每个人的数学都是正确的。但是,一旦超过一定规模,这就无法实现了。但现在借助 Lean 编译器,它能自动检查。团队成员无法上传任何编译不通过的内容,会被拒绝。因此,你可以与一些从未见过的人合作。

5.最后是讲大语言模型,首先陶哲轩就打脸了 GPT-4 的论文(我猜是微软那篇《GPT-4,通用人工智能的火花》),论文中号称 GPT-4 能解决国际数学奥林匹克问题,但实际上,这个问题不是 2022 年国际奥数竞赛的原始问题,而是一个简化版本,并且他们测试了几百道国际奥数竞赛问题,成功率只有1%,论文里的这个是精心挑选的恰巧能做对的。

6.陶哲轩提到了基于大语言模型的一些改进的方案:

比如 CoT(Chain of Thought),也就是 LLM 做简单的算术运算都做不对,但是如果让它一步步解释,可能就对了。还可以教 AI 一些解题技巧,比如尝试简单的例子,反证法,尝试逐步证明等。

比如让模型和编程语言或者工具连接,将大语言的输出结果交给 Wolfram 这样的专业数学工具或者 Python 这样的编程语言验证,并且迭代的进行修正和验证,直到得到正确的结果,这可以提升大语言模型生成的效果。

即使借助这些手段,大语言模型还远远不能解决大多数数学问题,更不用说数学研究问题了!

7.当然陶哲轩也没太过打击大家对于 AI 的信心,表示我们在 AI 上还是在不断的取得进展,还提到了他日常是怎么用 AI 的,比如说把 AI 当成灵感之源。

> 我曾遇到过一个问题,我尝试了几种方法,但都无法解决。于是,我尝试询问 GPT,你建议我使用什么其他方法来解决这个问题?GPT 给我提供了 10 种可能的方法,其中有 5 种我已经尝试过,或者明显没有帮助。的确,有几种方法并不实用。但其中有一种我还没尝试过的方法,那就是针对这个问题使用生成函数。当 GPT 建议我使用这种方法时,我意识到这就是我漏掉的正确方法。所以,将 GPT 视为一个交流伙伴,它确实具有一定的用处。

还有使用 GitHub Copilot 帮他写代码,让它自动生成下一步的证明结果,Copilot 的智能提示有 20% 的概率能生成正确的下一步结果。

> 例如我使用的一个叫 GitHub Copilot 的工具,你只需要写下一半的证明,它就会尝试猜测接下来的内容。大概有 20% 的情况下,它能猜到接近正确的答案。然后你就可以说,我接受这个答案。好的,那么在这种情况下,我正在试图证明这个陈述。灰色的部分是 Copilot 给出的建议。结果发现第一行完全没用。不过第二行,尽管你可能看不清楚,却真的解决了这个问题。所以,你不能盲目接受它的输入,因为这些代码未必能顺利编译。但如果你对代码的运作方式已经有所了解,这将大大节省你的时间。这些工具正在变得越来越好。现在如果一个证明只需要一两行,它们就能自动完成。现在已经有了这样的实验,即通过迭代地让 AI 提供证明,然后让编译器进行反馈,如果编译出错,就把错误信息反馈给 AI。通过这种方法,我们开始能够验证四五步长的证明。当然,一个大型的证明可能需要数万行。所以,我们还没有达到能够立即得到一个正式证明的程度。但是,这已经是一个相当有用的工具。

8.对于大家关心的问题: AI 在数学领域现在到了哪一个阶段?是否未来几年利用 AI 能直接解决数学问题?

陶哲轩也给出了他的看法:
> 我认为我们还远远没有达到这个阶段。如果我们专注于非常特定的问题,你可以定制专门的 AI 来处理一小部分问题。即便如此,它们也不是完全可靠的,但还是有用的。不过至少在接下来的几年里,它们基本上将是非常有用的辅助工具,超越了我们已经熟悉的暴力计算辅助。

他还提到了一些可能的 AI 能在数学领域提供帮助的方向:
- AI 能够非常好地生成有价值的猜想

> 比如,我们已经看到了关于结理论的例子,它们已经可以推测出两个不同的统计量之间的关系。因此,我们希望能够创建大量的数据集,输入到 AI 中,它们就会自动找出各种不同的数学对象之间的有趣联系。虽然我们还不知道如何做到这一点,部分原因是我们没有这些庞大的数据集。但我认为这是未来可能实现的一个方向。

- 批量或者说规模化的证明大量数学定理

> 现在,因为证明定理是如此繁琐和艰难的过程,我们一次只能证明一个定理,如果你效率很高,可能一次能证明两三个。但是有了 AI,你可以设想一下未来的情况,我们不是试图解决一个问题,而是处理一类类似的1000个问题,然后告诉AI,尝试用这个方法解决这 1000 个问题,然后报告结果,哦,我能用这种技术解决 35% 的问题。那么另一种技术呢?我能解决这个百分比的问题。或者如果结合这些方法,又能解决多少问题?你可以开始探索问题的空间,而不是一个接一个地解决问题。这是你现在根本无法做到的事情,或者是你需要几十年时间,通过数十篇论文慢慢搞清楚各种技术能做什么,不能做什么。但是有了这些工具,你真的可以开始做规模前所未有的数学研究。所以,未来将会非常令人兴奋。

9.演讲环节结束前的最后一句话说的特别好:
> 我们仍然会以传统方式证明定理。事实上,我们必须这样做,因为如果我们自己都不知道如何做这些事情,就无法引导这些 AI。但是我们将能够做很多现在无法做到的事情。

这恰恰也是我们现在使用 AI 辅助编程的问题:如果我们自己都不知道如何构建软件,就很难引导好 AI 帮助我们生成高质量的代码。

尽管 AI 在数学和编程领域变得越来越有用,但人类的洞察力和创造力仍然是创作价值的关键。

总结的内容源自宝玉大佬总结

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
分享一个二维数字人生产项目awesome-digital-human-live2d ,可本地部署,可Docker部署。

项目地址:https://github.com/wan-h/awesome-digital-human-live2d

参考:这里

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#Hosts #SwitchHosts #Github #Onedrive #推荐

推荐一款Hosts管理工具:Switch Host

项目简介SwitchHosts,是一款可以方便地管理自己电脑的Hosts的软件;支持本地添加Hosts和一键添加可在线更新Hosts的服务;提供Windows、MacOS平台支持。


项目地址:https://github.com/oldj/SwitchHosts/releases (该作者还开发了妙笔生花WonderPen 等软件)

补充资源
我收集的、可在线更新Hosts的服务(可复制Hosts,直接使用)

Github Hosts(三选一即可):

https://hosts.gitcdn.top/hosts.txt

https://raw.hellogithub.com/hosts

https://gitlab.com/ineo6/hosts/-/raw/master/hosts

Onedrive Hosts:

https://onedrive-hosts.learningman.top

更多请关注耕读博客

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#Matrix #代码 #自动生成 #口算

碎言大佬
提供的有趣的东西:

1. 黑客帝国Matrix代码效果(可以复制代码使用):
https://suiyan.cc/Matrix/

2.小学生口算题自动生成:
https://suiyan.cc/demo/psm/home源码

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#软件 #下载 #方法 #Google #Windows #Mac #Copilot #AI #秘塔搜 #网站 #推荐

1.无论是MacOS还是Windows系统,大家尽量安装官方的系统、软件,如Windows、Office(可选官方正版或MSDN版)、PS等,可以相对提高电脑的安全性,也支持软件开发者,尊重其智慧和辛劳;

2. 如需特别版的软件,可以遵循的原则是:开源、信誉好的软件、项目优先考虑; 优先使用Google或人工智能服务探索所需软件:

通常通过谷歌探索所需软件即可获得,如 “office 2021 mac download”,就可以发现微软官方下载链接苹果官方下载地址 ,以及第三方提供的可以下载并激活Mac office的Github开源项目,专门提供Office mac下载和激活的第三方网站 https://macadmins.software/ 这四个网址都可以下载,后面两个都可以激活,而且信誉都非常好。

另外一种方法,就是通过微软的Copilot人工智能服务询问,她通常会给出下载链接;还有一种,就是通过秘塔搜https://metaso.cn/ )人工智能来搜索软件,在国内软件上,应该有一定的优势。(可靠性暂时不如谷歌的核定)

3. 不太推荐的下载软件的方式
部分大佬出于学习、研究需要,或为了改善软件等,破解并分享了一些软件,供大家学习、交流使用,根据我使用经验和目前可用的网站,暂提供几个常用的Windows软件下载地址:

- 擅长探索的高木同学(TG频道,比较可信)

- m0nkrus 官网(Windows软件,比较可信,下载需注册;Mac软件,比较可信的团队包括TNT 或HCiSO)

- http://www.th-sjy.com/ (比较可信)

- https://software.nite07.com/ (比较可信)

- https://www.ypojie.com/ (比较可信)

- https://masuit.org/ (懒得勤快官网,TG频道:https://t.me/ldqk2 ;可信度未知)

- Anti_MKD (TG频道,为较少的几款软件提供更新;可信度未知)

- https://www.423down.com/ (据悉信誉不好,不太建议)

- https://ruanjianku.cloud/8度科技大佬的网站,根据频道内容推测,不太建议)

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#探索 #小技巧 #图 #分享

分享几张关于探索技巧、电脑技巧的图

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#Mac #OS #苹果电脑 #软件 #常用 #下载 #推荐

分享几个MacOS软件下载地址,安全性待检验(个人学习用,欢迎大佬提出意见和建议):

https://xmac.app/ (可用,已验证)

https://nmac.to/ (可用,已验证)

https://haxmac.cc/ (可用,已验证)

https://appstorrent.ru/ (可用,已验证)

https://www.torrentmac.net (可用,已验证)

https://xclient.info/ (蓝奏云,城通云下载;可用,已验证)

https://macwk.cn/ (更新快、全面;存放在夸克网盘;需夸克网盘下载,未验证)

https://macapp.org.cn/ (多个网盘下载;有的需要注册登录)

https://cmacked.com/ (1年未更新,之前的还可以用)

https://www.minorpatch.com/ (Onedrive下载密码:minor 或 digit77 ;文件解压密码: minorpatch.com 或 digit77.com,已验证)

https://www.ypojie.com/pc/macos (软件收录较少,多个网盘下载方式,可用性未验证)

https://maczz.net/ (123网盘,未验证)

https://macbang.net/ (需注册登录,未验证)

https://macenjoy.net/ (城通网盘,未验证)

https://www.macbl.com/ (城通网盘,未验证)

https://www.macdo.cn/ (需注册登录,部分需要付费下载)

https://www.macappbox.com/ (需登录、好的软件需付费下载,未验证)

——————

https://github.com/TrialMacApp/TrialMacApp (延长试用来使用正版软件)

https://appwall.today/ ( 限免或减免)

https://free.apprcn.com/category/mac/ ( 限免或减免)

https://macked.app/ (需注册登录下载)


——————
最佳Mac软件(Awesome Macos Software):

https://github.com/jaywcjlove/awesome-mac/

https://github.com/iCHAIT/awesome-macOS

https://github.com/qianguyihao/Mac-list

——————

Mac软件测评
https://www.waerfa.com/category/review/mac-app-review

https://sspai.com/tag/Mac


——————
Macos工具
Mist: https://github.com/ninxsoft/Mist (MacOS下载工具;Macos系统尽量用App Store下载、定制U盘启动盘+安装的方式装系统;另一个网站Sysin提供了百度云盘下载Macos的方式;(该站提供了MacOS等教程和各个版本Macos的系统下载 ,尽量用官方的系统))

OpenCore Legacy Patcher: https://github.com/dortania/OpenCore-Legacy-Patcher (让Macos电脑,通过安装软件的方式,跳过官方限制,升级到新的系统,参考Sysin的教程 )。

参考这里这里这里

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#VPS #Cloudcone #周年庆活动

Cloudcone是一家提供虚拟云服务的公司,其产品目前性对比较稳定,IP地址还算比较干净,许多博主选择其服务来寄存博客程序和内容等。

Cloudcone近期推出了一项周年庆活动,如图所示。目前13.5$/Year的这个和19.99/Year的服务,都还比较划算。有需要的朋友,可以考虑近期注册。

图一活动地址,图二活动地址

还未注册Cloudcone的,可以点击这里注册(含Aff)。

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#网盘探索服务 #一键部署 #自建

分享一个一键部署自己的网盘探索服务:爱盼

爱盼,是一个免费开源的、网盘探索服务的项目;目前可以通过Vercel一键部署。

项目网址:https://github.com/unilei/aipan-netdisk-search

Demo网址: https://www.kkwnhub.com

感兴趣的,可以自行部署。记得给该项目主一个Star,支持开源项目。

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#域名 #服务 #登记 #更新 #转移 #涨价

目前,域名注册商NameCheap及其子公司Spaceship发邮件通知,自9月2日开始,域名的注册登记、转移等服务费用将普遍提升,幅度较大。

其中.com域名提升为16.88;.xyz、.lol域名更新费用是$15.98。

有需要的朋友,可以考虑在9月2日涨价前,续费、转移等。

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
#AI #Midjourney #文本生成图片 #注册 #推荐
类似于OpenAI的DALL-E3的文生图服务Midjourney现在开放用户注册使用,用户目前可以体验基础班,每周25张画;画质优美,堪称大师级(配图为MidJourney生成的图片)。

网址:http://midjourney.com/

说明:注册时仅支持Gmail账号或Discord账号来注册MidJourney账号。

目前,免费用户也可以使用OpenAI的DALL-E3。登录ChatGPT.com,使用ChatGPT 4o mini,每天可以免费画2张图。

更多AI资讯,参考 https://www.sumeai.com

📢 频道 ✈️ 群聊 (耕读) 📬 投稿
Back to Top