ฉันใช้เทคโนโลยีใหม่ของ OpenAI เพื่อถอดเสียงจากแล็ปท็อปของฉัน

ภาพประกอบชุดไมโครโฟนสีน้ำเงินบนพื้นหลังสีน้าน ประโยชน์ของ AI ที่ไม่มีข้อเสียของคลาวด์ | Kristen Radtke / The Verge; เก็ตตี้อิมเมจ

OpenAI บริษัทที่อยู่เบื้องหลังโปรแกรมสร้างภาพและ โปรแกรมสร้างมีม DALL-E และเอ็นจิ้นการ เติมข้อความอัตโนมัติอันทรงพลัง GPT-3 ได้เปิดตัวเครือข่ายนิวรัลโอเพนซอร์ซใหม่เพื่อถ่ายทอดเสียงเป็นข้อความที่เขียน ( ผ่าน TechCrunch ) เรียกว่า Whisper และ บริษัทกล่าวว่า “เข้าใกล้ความแข็งแกร่งและความถูกต้องในระดับมนุษย์ในการรู้จำคำพูดภาษาอังกฤษ” และยังสามารถจดจำ ถอดเสียง และแปลภาษาอื่นๆ เช่น สเปน อิตาลี และญี่ปุ่นได้โดยอัตโนมัติ

ในฐานะที่เป็นคนที่บันทึกและถอดความบทสัมภาษณ์อยู่ตลอดเวลา ฉันรู้สึกตื่นเต้นทันทีเกี่ยวกับข่าวนี้ ฉันคิดว่าจะสามารถเขียนแอปของตัวเองเพื่อถอดเสียงจากคอมพิวเตอร์ได้อย่างปลอดภัย ในขณะที่บริการบนคลาวด์อย่าง Otter.ai และ Trint ทำงานให้กับ…

อ่านต่อไป…

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น