Deep Cogito ปรากฏตัวจากการลักลอบด้วยแบบจำลองการใช้เหตุผลของไฮบริด AI

0
102


บริษัท ใหม่ cogito ลึกได้โผล่ออกมาจากการลักลอบพร้อมกับครอบครัวของรุ่น AI ที่มีอยู่อย่างเปิดเผยซึ่งสามารถสลับระหว่าง “การใช้เหตุผล” และโหมดที่ไม่สมเหตุสมผล

รูปแบบการใช้เหตุผลเช่น Openai’s O1 ได้แสดงให้เห็นถึงคำสัญญาที่ยอดเยี่ยมในโดเมนเช่นคณิตศาสตร์และฟิสิกส์ด้วยความสามารถในการตรวจสอบข้อเท็จจริงอย่างมีประสิทธิภาพโดยการทำงานผ่านปัญหาที่ซับซ้อนทีละขั้นตอน เหตุผลนี้มาพร้อมกับค่าใช้จ่าย: การคำนวณที่สูงขึ้นและเวลาแฝง นั่นคือเหตุผล ห้องปฏิบัติการเช่นมานุษยวิทยา กำลังดำเนินการตามสถาปัตยกรรมแบบ“ ไฮบริด” ที่รวมองค์ประกอบการใช้เหตุผลเข้ากับองค์ประกอบมาตรฐานที่ไม่สมเหตุสมผล โมเดลไฮบริดสามารถตอบคำถามง่ายๆได้อย่างรวดเร็วในขณะที่ใช้เวลาเพิ่มเติมโดยพิจารณาจากการสืบค้นที่ท้าทายมากขึ้น

โมเดลของ Deep Cogito ทั้งหมดเรียกว่า Cogito 1 เป็นรุ่นไฮบริด Cogito อ้างว่าพวกเขามีประสิทธิภาพสูงกว่ารุ่นเปิดที่ดีที่สุดในขนาดเดียวกันรวมถึงรุ่นจาก Meta และการเริ่มต้น AI ของจีนและจีน ลึกล้ำ

“ แต่ละรุ่นสามารถตอบโดยตรง (…) หรือสะท้อนตนเองก่อนที่จะตอบ (เช่นรูปแบบการใช้เหตุผล)” บริษัท อธิบายในโพสต์บล็อก– “ (ทั้งหมด) ได้รับการพัฒนาโดยทีมเล็ก ๆ ในเวลาประมาณ 75 วัน”

โมเดล Cogito 1 มีพารามิเตอร์ 3 พันล้านพารามิเตอร์ถึง 70 พันล้านพารามิเตอร์และ Cogito กล่าวว่าโมเดลที่มีความหลากหลายสูงถึง 671 พันล้านพารามิเตอร์จะเข้าร่วมในสัปดาห์และเดือนที่จะถึงนี้ พารามิเตอร์ประมาณสอดคล้องกับทักษะการแก้ปัญหาของโมเดลโดยทั่วไปจะดีกว่าพารามิเตอร์ที่ดีกว่า

Cogito 1 ไม่ได้รับการพัฒนาตั้งแต่เริ่มต้นเพื่อให้ชัดเจน Deep Cogito สร้างขึ้นบน Llama Open Llama ของ Meta และ Qwen ของ Alibaba เพื่อสร้างตัวเอง บริษัท บอกว่าใช้วิธีการฝึกอบรมใหม่เพื่อเพิ่มประสิทธิภาพของโมเดลพื้นฐานและเปิดใช้งานการใช้เหตุผลแบบสลับ

จากผลการเปรียบเทียบภายในของ Cogito ซึ่งเป็นโมเดล Cogito 1 ที่ใหญ่ที่สุด Cogito 70b โดยมีเหตุผลสูงกว่ารูปแบบการให้เหตุผล R1 ของ Deepseek ในการประเมินคณิตศาสตร์และภาษา Cogito 70b ที่มีการใช้เหตุผลปิดการใช้งานยังทำให้ Meta รุ่น Llama 4 Scout รุ่นที่เพิ่งเปิดตัวของ Meta ที่เพิ่งเปิดตัวใน LiveBench ซึ่งเป็นการทดสอบ AI ที่มีวัตถุประสงค์ทั่วไป

ทุกรุ่น Cogito 1 มีให้ดาวน์โหลดหรือใช้งานผ่าน APIs บน Fireworks AI ของผู้ให้บริการคลาวด์และ AI ร่วมกัน

cogito ลึก
ประสิทธิภาพของ Cogito 1 เมื่อเทียบกับรุ่น AI ยอดนิยมอื่น ๆเครดิตภาพ:cogito ลึก

“ ปัจจุบันเรายังอยู่ในช่วงเริ่มต้นของเส้นโค้งการปรับขนาด (ของเรา) โดยใช้เพียงเศษเสี้ยวของการคำนวณที่มักจะสงวนไว้สำหรับการโพสต์รูปแบบภาษาขนาดใหญ่แบบดั้งเดิม/การฝึกอบรมอย่างต่อเนื่อง” Cogito เขียนในโพสต์บล็อก “ ก้าวไปข้างหน้าเรากำลังตรวจสอบวิธีการฝึกอบรมหลังการฝึกอบรมเพื่อการพัฒนาตนเอง”

ตามที่ยื่นต่อรัฐแคลิฟอร์เนียDeep Cogito ที่ตั้งอยู่ในซานฟรานซิสโกก่อตั้งขึ้นในเดือนมิถุนายน 2567 บริษัท หน้า LinkedIn แสดงรายการผู้ร่วมก่อตั้งสองคนคือ Drishan Arora และ Dhruv Malhotra Malhotra เคยเป็นผู้จัดการผลิตภัณฑ์ที่ Google Ai Lab Deepmind ซึ่งเขาทำงานเกี่ยวกับเทคโนโลยีการค้นหาแบบกำเนิด Arora เป็นวิศวกรซอฟต์แวร์อาวุโสที่ Google

Deep Cogito ซึ่งผู้สนับสนุนรวมถึง South Park Commons ตาม Pitchbookโดยมีจุดมุ่งหมายอย่างทะเยอทะยานในการสร้าง“ ผู้ปกครองทั่วไป” ผู้ก่อตั้ง บริษัท เข้าใจวลีที่จะหมายถึง AI ที่สามารถทำงานได้ดีกว่ามนุษย์ส่วนใหญ่และ“ เปิดเผยความสามารถใหม่ทั้งหมดที่เรายังไม่ได้จินตนาการ”

(tagstotranslate) deep cogito

LEAVE A REPLY

Please enter your comment!
Please enter your name here