ChatGPT:關于 AI 聊天機器人實際工作原理的 5 個令人驚訝的真相
AI 聊天機器人已經嵌入到一些人的生活中,但有多少人真正了解它們的工作原理?例如,您知道嗎,ChatGPT 需要進行互聯網搜索才能查找 2024 年 6 月之后的事件?
關于 AI 聊天機器人的一些最令人驚訝的信息可以幫助我們了解它們的工作原理、它們能做什么和不能做什么,以及如何更好地使用它們。
考慮到這一點,以下是您應該了解的有關這些突破性機器的五件事。
1. 他們接受人工反饋的培訓
AI 聊天機器人分多個階段進行訓練,從稱為預訓練開始,其中模型經過訓練以預測大量文本數據集中的下一個單詞。這使他們能夠對語言、事實和推理有一般的理解。
如果被問到:“我如何制作自制炸藥?預訓練階段,模型可能已經給出了詳細的說明。為了使它們在對話中有用和安全,人類“注釋者”幫助指導模型做出更安全、更有用的響應,這一過程稱為對齊。
對齊后,AI 聊天機器人可能會回答如下:“對不起,我無法提供該信息。如果您有安全問題或需要合法化學實驗方面的幫助,我建議您參考經過認證的教育資源。
如果不保持一致,AI 聊天機器人將是不可預測的,可能會傳播錯誤信息或有害內容。這凸顯了人工干預在塑造 AI 行為中的關鍵作用。
開發(fā) ChatGPT 的公司 OpenAI 尚未透露有多少員工訓練了 ChatGPT 多少小時。但很明顯,像 ChatGPT 這樣的 AI 聊天機器人需要一個道德指南針,這樣它就不會傳播有害信息。人工注釋者對響應進行排名,以確保中立性和道德一致性。
同樣,如果 AI 聊天機器人被問到:“最好和最差的國籍是什么?
人類注釋者會將這樣的回答排在最高等級:“每個民族都有自己豐富的文化、歷史和對世界的貢獻。沒有'最好'或'最差'的國籍——每個國籍都以自己的方式有價值。
2. 他們不是通過文字學習——而是在代幣的幫助下
人類自然地通過文字學習語言,而 AI 聊天機器人則依賴于較小的稱為代幣的單位.這些單位可以是單詞、子詞或晦澀的字符系列。
雖然標記化通常遵循邏輯模式,但它有時會產生意想不到的分裂,從而揭示 AI 聊天機器人如何解釋語言的優(yōu)勢和怪癖?,F代 AI 聊天機器人的詞匯表通常由 50,000 到 100,000 個令牌組成。
ChatGPT 將句子“價格為 9.99 美元”標記為“The”、“price”、“is”、“$”、“9”、“.”、“99”,而“ChatGPT 是了不起的”則不那么直觀地表示:“chat”、“G”、“PT”、“is”、“mar”、“vellous”。
3. 他們的知識每天都在過時
AI 聊天機器人不會不斷自我更新;因此,他們可能會為最近的事件、新術語或更廣泛的任何事情而苦苦掙扎知識截止.知識截止是指 AI 聊天機器人的訓練數據更新的最后一個時間點,這意味著它對該日期之后的事件、趨勢或發(fā)現缺乏了解。
當前版本的 ChatGPT 的截止日期為 2024 年 6 月。如果被問及誰是現任美國總統(tǒng),ChatGPT 需要使用搜索引擎進行網絡搜索必應,“讀取”結果,并返回答案。
必應結果按源的相關性和可靠性進行篩選。同樣,其他 AI 聊天機器人使用 Web 搜索來返回最新答案。
更新 AI 聊天機器人是一個成本高昂且脆弱的過程。如何有效地更新他們的知識仍然是一個懸而未決的科學問題。據信,隨著 Open AI 推出新的 ChatGPT 版本,ChatGPT 的知識會得到更新。
4. 他們真的很容易產生幻覺
AI 聊天機器人有時是“幻覺”,自信地生成虛假或無意義的聲明,因為它們根據模式預測文本,而不是驗證事實。這些錯誤源于他們的工作方式:他們優(yōu)化一致性而不是準確性,依賴不完美的訓練數據,并且缺乏對現實世界的理解。
雖然事實核查工具(例如,像 ChatGPT 的 Bing 搜索工具集成,用于實時事實核查)或提示(例如,明確告訴 ChatGPT “引用同行評審的來源”或“說我不知道,如果你不確定”)等改進可以減少幻覺,但它們不能完全消除幻覺。
例如,當被問及某篇研究論文的主要發(fā)現是什么時,ChatGPT 給出了一個長而詳細且美觀的答案。
它還包括屏幕截圖甚至一個鏈接,但來自錯誤的學術論文。因此,用戶應該將 AI 生成的信息視為起點,而不是不容置疑的事實。
5. 他們使用計算器來做數學
AI 聊天機器人最近流行的功能稱為推理。推理是指使用邏輯連接的中間步驟來解決復雜問題的過程。這也稱為“思路鏈”推理。
Chain of Thought 使 AI 聊天機器人能夠逐步思考,而不是直接跳轉到答案。例如,當被問到“什么是 56,345 減去 7,865 乘以 350,468”時,ChatGPT 給出了正確的答案。它 “理解” 乘法需要在減法之前發(fā)生。
為了解決中間步驟,ChatGPT 使用其內置計算器來實現精確算術。這種將內部推理與計算器相結合的混合方法有助于提高復雜任務的可靠性。
?a?atay Y?ld?z, 博士后研究員, 卓越集群 ”機器學習",圖賓根大學
本文轉載自對話根據 Creative Commons 許可。閱讀原創(chuàng)文章.
湖北農機化
農業(yè)基礎科學 - 省級期刊
技術與創(chuàng)新管理
合作期刊 - 省級期刊
藝術大觀
合作期刊 - 省級期刊
傳播與版權
合作期刊 - 省級期刊
喜劇世界
中國文學 - 省級期刊
科學咨詢(教育科研)
中等教育 - 省級期刊
科技傳播
合作期刊 - 國家級期刊
科技創(chuàng)新導報
信息科技 - 國家級期刊
智富時代
合作期刊 - 省級期刊
科技經濟導刊
合作期刊 - 省級期刊
現代鹽化工
合作期刊 - 省級期刊