NG体育官网app下载繼擊敗人類圍棋大師和戰略棋盤游戲頂尖高手之后,谷歌“深度思維”公司人工智能(AI)系統在英國巴斯舉行的2024年國際數學奧林匹克競賽(IMO)上,僅以1分之差與金牌失之交臂,獲得了銀牌。這是AI選手首次登上IMO領獎台。
英國《自然》雜志網站在7月27日的報道中指出,“深度思維”正與其他公司競相解決數學領域的疑難問題。近年來,IMO被廣泛認為是對機器學習的一個挑戰,也是衡量AI系統高級數學推理能力的理想基准。AI系統在今年IMO中的精彩表現,標志著其即將再下一城:在解決數學難題方面擊敗世界頂尖學生。
“深度思維”公司訓練了一個專門用於解答數學奧賽考題的AI系統,成功解答了6道競賽題中的4道,獲得28分(滿分42分),達到本次比賽銀牌獲得者的水平。
今年1月份,AlphaGeometry在解決歐幾裡得幾何問題上,就已表現出獎牌級選手的水平。在今年的IMO比賽前,AlphaGeometry 2已經能夠解決過去25年裡83%的IMO幾何問題,而其“前身”僅能解決53%。
“深度思維”公司AI科學副總裁普什米特·科利指出NG体育娱乐,這是AI系統首次達到獲IMO獎牌級別的性能。IMO主席格雷戈爾·多利納爾也表示,AI最終將能比人類更好地解決大多數數學問題,其進步速度令人驚嘆。
幾乎同一時間,軟件公司Numina的科學家使用語言模型,贏得了AI數學奧林匹克獎(AIMO)的首個“進步獎”。
但Numina團隊在獲獎后表示,要解決更難的數學問題,僅靠語言模型可能還不夠。
AlphaProof是一個自學習系統,其核心創新在於結合預訓練語言模型與AlphaZero強化學習算法的策略。強化學習是機器學習領域一種重要的學習范式,系統可通過多次嘗試找到自己的解題方法。
這種方法需要用AI能理解和驗証的語言編寫大量問題,而大多數IMO問題都是用英語編寫的。為解決這個問題,“深度思維”團隊托馬斯·赫伯特及其同事使用谷歌的大語言模型Gemini,將這些問題翻譯成一種名為Lean的編程語言,以供AI進行學習。
AlphaProof使用經過微調的Gemini模型,自動將數學問題轉換為Lean語言,從而創建了一個涵蓋不同難度級別的大型問題庫。在強化學習階段,系統每驗証一個証明NG体育娱乐,就用它來強化AlphaProof的語言模型,提高其解決后續更具挑戰性問題的能力。
赫伯特表示,在挑戰圍棋游戲時,他們也採用了類似的方法:AI通過與自己對抗,來學習如何更好地玩游戲。結果顯示,在某些情況下,AlphaProof能夠在無限多的可能性中邁出正確的一步,展現出“靈光一閃”的能力。
盡管AlphaProof的表現令人印象深刻,但其速度相對較慢,解決3個問題耗費了3天時間,而人類參賽者僅需4個半小時。此外,它也未能回答兩個與組合數學有關的問題。
英國數學家約瑟夫·邁爾斯審查了AI在本次IMO比賽中給出的答案。他指出,AlphaProof採取的這些技術能否予以完善還有待觀察。
英國倫敦數學科學研究所何楊輝稱,AlphaProof這樣的系統對於幫助數學家証明問題很有用,但它無法幫助研究人員確定需要解決和研究的問題。
“深度思維”團隊表示,他們正繼續探索多種用於推進數學推理的AI方法NG体育娱乐。未來NG体育娱乐,數學研究者將與AI合作驗証假說,嘗試新方法來解決長期未解決的數學難題。他們也希望AlphaProof能夠通過減少錯誤響應,幫助改進谷歌的大型語言模型。
人民網北京8月4日電 (記者黃盛)進一步豐富寬基指數、“五篇大文章”指數、“上海指數”和跨境指數,打造“上市公司—指數—指數產品—投資者”相互促進良性循環的指數化投資市場NG体育娱乐,完善適合包括中長期機構在內各類投資者參與的指數化投資生態…… 日前,上交所制定完成《指數業務三年行動方案(2024—2026年)》(以下簡稱《行動方案》),進一步提升本土指數影響力競爭力,推動指數化投資理念為更多投資者所認可和接受,引導增量資金通過指數產品持續流入市場。 具體來看,《行動方案》主要包括三方面內容。…
“加大金融對實體經濟的支持力度,把著力點更多轉向惠民生、促消費”“進一步深化金融供給側結構性改革,扎實做好‘五篇大文章’”“推進外匯領域深層次改革和高水平開放”“更大力度服務實體經濟回升向好,推動股票發行注冊制走深走實”……日前,人民銀行、金融監管總局、國家外匯管理局、証監會分別召開會議,部署下半年工作。 人民銀行:金融支持實體更多轉向惠民生促消費 8月2日,人民銀行召開2024年下半年工作會議。…
人民日報社概況關於人民網報社招聘招聘英才廣告服務合作加盟供稿服務數據服務網站聲明網站律師信息保護聯系我們
人 民 網 股 份 有 限 公 司 版 權 所 有 ,未 經 書 面 授 權 禁 止 使 用