คลิกขวาล่างเพื่อดาวน์โหลดหรือค้นหาใน Apple Podcasts, Spotify, Stitcher เป็นต้น
ฉันได้โต้แย้งว่าการพัฒนา AI ขั้นสูงสามารถทำให้ศตวรรษนี้กลายเป็น ศตวรรษที่สำคัญที่สุด สำหรับมนุษยชาติ ปฏิกิริยาทั่วไปต่อแนวคิด นี้ คือความเห็นโดย Tyler Cowen ว่า “นักคิดในอดีตสามารถทำนายอนาคตได้ดีเพียงใด อย่าเลือกเพียงแค่คนที่โด่งดังเพราะพวกเขามีสิ่งที่ยิ่งใหญ่ที่ถูกต้อง”
นี่เป็นเหตุผลทั่วไปที่ผู้คนมักสงสัยเกี่ยวกับ ศตวรรษที่สำคัญที่สุด และบ่อยครั้งสำหรับความกังขาเกี่ยวกับความพยายามใน ลัทธิอนาคต (พยายามทำนายเหตุการณ์สำคัญในโลกนี้เป็นเวลานาน) หรือการ บังคับทิศทาง โลกนำทางเหตุการณ์สำคัญในอนาคตดังกล่าว)
แนวความคิดนี้มีลักษณะดังนี้: “แม้ว่าเราจะไม่สามารถระบุจุดอ่อนเฉพาะใน การโต้แย้ง เกี่ยวกับเหตุการณ์สำคัญในอนาคตได้ บางทีเราควรสงสัยในความสามารถของเราเองที่จะพูดอะไรที่มีความหมายเกี่ยวกับอนาคตในระยะยาว ดังนั้นบางทีเรา ควรลืมเกี่ยวกับทฤษฎีแห่งอนาคต และมุ่งไปที่การลดความทุกข์ในปัจจุบัน โดยทั่วไปจะเพิ่มขีดความสามารถของมนุษย์ เป็นต้น”
แต่โดย ทั่วไป แล้วผู้คนมักคาดเดาเหตุการณ์ในอนาคตได้ไม่ดีหรือไม่? รวมถึงคนช่างคิดที่พยายามอย่างหนักพอสมควรที่จะเป็นฝ่ายถูก? หากเรามองย้อนกลับไปที่คำทำนายของนักอนาคตที่มีชื่อเสียง ประวัติที่แท้จริงเป็นอย่างไร สถานการณ์เลวร้ายแค่ไหน?
ฉันได้ดูค่อนข้างไกลและกว้างสำหรับคำตอบที่ เป็นระบบ สำหรับคำถามนี้และ 1 Luke Muehlhauser ของ Open Philanthropy ได้ใช้ความพยายามพอสมควรในการค้นคว้า ฉันพูดถึงสิ่งที่เราพบใน ภาคผนวก จนถึงตอนนี้ เรายังไม่พบมากทั้งหมด – ข้อสังเกตหลักคือ เป็นการยากที่จะตัดสินประวัติของนักอนาคตนิยม (ลุคพูดถึงความยากลำบาก ที่นี่ )
เมื่อเร็ว ๆ นี้ ฉันได้ทำงานร่วมกับ Gavin Leech และ Misha Yagudin ที่ Arb Research เพื่อแก้ไขปัญหานี้อีกครั้ง ฉันพยายามทำให้สิ่งต่าง ๆ ง่ายกว่าความพยายามในอดีต – เพื่อดูนักอนาคตในอนาคตสองสามคนที่ (a) ทำนายสิ่งต่าง ๆ “คล้าย” ความก้าวหน้าใน AI (แทนที่จะเช่นการทำนายแนวโน้มของประชากรโลก); (b) อาจคิดอย่างมีเหตุผลเกี่ยวกับเรื่องนี้ แต่ (c) ไม่ชัดเจนนัก “เลือกเฉพาะคนที่มีชื่อเสียงเพราะพวกเขามีสิ่งที่ถูกต้อง” ดังนั้นฉันจึงขอให้ Arb ดู คำทำนายของนักเขียนนิยายวิทยาศาสตร์ “บิ๊กทรี” ในช่วงกลางศตวรรษที่ 20 ได้แก่ Isaac Asimov, Arthur C. Clarke และ Robert Heinlein
คนเหล่านี้เป็นคนที่คิดมากเกี่ยวกับวิทยาศาสตร์และอนาคต และคาดการณ์มากมายเกี่ยวกับเทคโนโลยีในอนาคต แต่พวกเขามีชื่อเสียงในด้าน ความบันเทิงในนิยายของพวกเขาในเวลา นั้น ไม่ใช่ว่าการทำนายสารคดีของพวกเขาจะดูดีเพียงใดในการมองย้อนกลับไป ฉันเลือกพวกเขาโดยจำได้คร่าวๆ ว่า “สามยักษ์ใหญ่แห่งนิยายวิทยาศาสตร์” เป็นสิ่งที่ผู้คนพูดกันในบางครั้ง ใช้กูเกิลและไปกับใครที่มา – ไม่ต้องตามล่าหานักเขียนแนวไซไฟจำนวนมากและเลือกสิ่งที่ดีที่สุดหรือแย่ที่สุด 2
ดังนั้น ฉันคิดว่าประวัติการทำงานของพวกเขาควรให้ความรู้สึกที่ดีแก่เราสำหรับ “สิ่งที่คาดหวังจากผู้ที่ไม่ใช่มืออาชีพ ผู้เชี่ยวชาญ หรือนักพยากรณ์ที่โชคดีอย่างเห็นได้ชัด แต่กำลังพยายามใช้ความคิดอย่างมีเหตุผล” ตามที่ฉันจะอธิบาย ด้านล่าง ฉันคิดว่านี่เป็นวิธีที่ “ไม่ยุติธรรม” หลายวิธีเมื่อเปรียบเทียบกับการคาดการณ์ในปัจจุบันเกี่ยวกับ AI: ฉันคิดว่าการคาดการณ์เหล่านี้ไม่จริงจังมากนัก พิจารณาให้รอบคอบน้อยกว่า และเกี่ยวข้องกับงานน้อยลง (โดยเฉพาะงานที่ชั่งน้ำหนักผู้คนและข้อโต้แย้งที่แตกต่างกัน กันและกัน).
แต่สิ่งที่ฉันทำได้คือ บันทึกการติดตามของพวกเขาดู … ดี! พวกเขาทำการคาดการณ์ที่ละเอียดและไม่ชัดเจนเกี่ยวกับอนาคตระยะยาว (30+ มักจะ 50+ ปี); ผลลัพธ์มีตั้งแต่ “น่าประทับใจมาก” (อาซิมอฟมีสิทธิ์ประมาณครึ่งหนึ่งโดยคาดการณ์ที่ดูเหมือนไม่ชัดเจน) ถึง “แย่” (ไฮน์ไลน์เกือบ 35% และการโจมตีของเขาดูไม่ค่อยดี) ถึง “ที่ไหนสักแห่งในระหว่าง ” (คลาร์กมีอัตราการโจมตีที่ใกล้เคียงกับอาซิมอฟ แต่การคาดการณ์ที่ถูกต้องของเขาดูไม่น่าประทับใจเท่าไหร่) มีการคาดคะเนที่ดูน่าประทับใจและน่าอายมากมาย
(เราจะกำหนดระดับความแม่นยำได้อย่างไรว่า “ดี” กับ “แย่” โชคไม่ดีที่ไม่มีเกณฑ์เปรียบเทียบเชิงปริมาณที่ชัดเจน – ฉันคิดว่าเราแค่ต้องดูการคาดคะเนด้วยตัวเองว่ามันยากแค่ไหน / คล้ายกับคำทำนายของวันนี้อย่างไร AI และทำการตัดสิน ฉันสามารถจินตนาการได้อย่างง่ายดายว่าคนอื่นมีการตีความที่แตกต่างจากของฉัน นั่นคือเหตุผลที่ฉันยกตัวอย่างและเชื่อมโยงไปยังชุดการทำนายทั้งหมด ฉันพูดถึงสิ่งนี้เพิ่มเติม ด้านล่าง )
พวกเขาไม่ใช่นักพยากรณ์ที่ผิดพลาด แต่ก็ไม่ได้สุ่มสี่สุ่มห้าเกี่ยวกับเรื่องนี้ (บางทีไฮน์ไลน์อาจเป็น) โดยรวมแล้ว ฉันคิดว่าคุณสามารถเรียกพวกเขาว่า “ธรรมดา” แต่คุณไม่สามารถเรียกพวกเขาว่า “สิ้นหวัง” หรือ “ไร้เงื่อนงำ” หรือ “สัญญาณเตือนแก่ทุกคนที่กล้าทำนายอนาคตในระยะยาวไม่ได้ ” โดยรวมแล้ว ฉันคิดว่าพวกเขาทำอย่างนั้นและคุณอาจไร้เดียงสา 3 เดาว่าคนที่มีไหวพริบดีจะทำอะไรโดยบังเอิญที่พวกเขาพยายามทำ?
ด้านล่าง ฉันจะ:
- สรุป ประวัติผลงานของอาซิมอฟ คลาร์ก และไฮน์ไลน์ พร้อมเชื่อมโยงไปยังรายงานฉบับสมบูรณ์ของ Arb
- แสดงความคิดเห็น ว่าทำไมฉันถึงคิดว่า การคาดคะเนที่สำคัญเกี่ยวกับ AI ที่เปลี่ยนแปลง ได้น่าจะเป็นเดิมพันที่ดีกว่าการคาดการณ์ของ Asimov/Clarke/Heinlein แม้ว่าในท้ายที่สุดแล้ว หากเป็นเพียง “การเดิมพันที่ดีพอๆ กัน” ฉันคิดว่ามันเพียงพอแล้วที่จะสนับสนุนกรณีของฉันที่เราควรจะจ่าย ให้ความสนใจกับสมมติฐาน “ศตวรรษที่สำคัญที่สุด” มาก ขึ้น
- สรุปงานวิจัยอื่นๆ ที่มีอยู่เกี่ยวกับประวัติของนักอนาคตนิยม ซึ่งฉันคิดว่าสอดคล้องกับแนวคิดนี้ในวงกว้าง (แต่ส่วนใหญ่คลุมเครือ)
สำหรับการตรวจสอบนี้ Arb ได้ขุดค้นแหล่งข้อมูลเก่าหลายๆ แหล่งอย่างรวดเร็ว (ในเวลาประมาณ 8 สัปดาห์) ใช้การจับคู่รูปแบบและความพยายามด้วยตนเองเพื่อค้นหาการคาดการณ์ และทำงานร่วมกับผู้รับเหมาเพื่อทำคะแนนจากการคาดการณ์หลายร้อยรายการที่พวกเขาพบ ขอบคุณมากสำหรับพวกเขา! รายงานฉบับเต็มของพวกเขาอยู่ ที่นี่ หมายเหตุเล็กน้อยนี้: “หากคุณพบเห็นบางอย่างผิดปกติ เราจะจ่ายเงิน $5 ต่อเซลล์ที่เราอัปเดตตามผลลัพธ์ เราจะเพิ่มคำวิจารณ์ทั้งหมดที่เราเห็นด้วยและอัปเดตหรือปฏิเสธในเอกสารนี้เพื่อความโปร่งใส”
ประวัติผลงาน “บิ๊กทรี”
สรุปอย่างรวดเร็วว่า Arb สร้างชุดข้อมูลอย่างไร
Arb รวบรวม “สำเนาดิจิทัลของสารคดี [ของอาซิมอฟ, คลาร์ก, ไฮน์ไลน์] ให้มากที่สุดเท่าที่จะเป็นไปได้ (หนังสือ เรียงความ บทสัมภาษณ์) ผลที่ได้คือ 475 ไฟล์ครอบคลุม ~ 33% ของศพที่ไม่ใช่นิยาย”
จากนั้น Arb ใช้การจับคู่รูปแบบและการตรวจสอบด้วยตนเองเพื่อดึงการคาดคะเนทั้งหมดที่หาพบ และทำคะแนนการคาดการณ์เหล่านี้โดย:
- ปรากฏว่าคำทำนายนั้นอยู่ห่างออกไปกี่ปี (ส่วนใหญ่ไม่ได้แนบวันที่ที่ชัดเจน ในกรณีเหล่านี้ Arb มักจะเติมขอบฟ้าเวลาเฉลี่ยสำหรับการคาดการณ์จากผู้เขียน คน เดียวกันซึ่งมีวันที่ชัดเจนที่แนบมาด้วย)
- ไม่ว่าการคาดคะเนจะปรากฏว่าถูกต้อง ไม่ถูกต้อง หรือคลุมเครือหรือไม่ (ฉันไม่ได้เห็นด้วยกับการให้คะแนนเหล่านี้เสมอไป แต่โดยทั่วไปแล้วฉันรู้สึกว่าการคาดคะเนที่ “ถูกต้อง” อย่างน้อยก็ดู “น่าประทับใจและไม่งี่เง่า” ในขณะที่การคาดการณ์ที่ “ไม่ถูกต้อง” อย่างน้อยก็ดู “เสี่ยง”)
- การคาดคะเนเป็นการคาดการณ์ล้วนๆ เกี่ยวกับสิ่งที่เทคโนโลยีสามารถทำได้ (เกี่ยวข้องมากที่สุด) การคาดการณ์เกี่ยวกับปฏิสัมพันธ์ของเทคโนโลยีและเศรษฐกิจ (ปานกลาง) หรือการคาดการณ์เกี่ยวกับปฏิสัมพันธ์ของเทคโนโลยีและวัฒนธรรม (มีความเกี่ยวข้องน้อยที่สุด) การคาดการณ์ที่ไม่มีผลกระทบต่อเทคโนโลยีลดลง
- การทำนาย “ยาก” เพียงใด (นั่นคือผู้ทำคะแนนเดาว่ามันแตกต่างจากภูมิปัญญาดั้งเดิมหรือ “สิ่งที่ชัดเจน” ในขณะนั้นมากเพียงใด – รายละเอียดในเชิงอรรถ 4 )
ที่สำคัญ นิยายไม่เคยถูกใช้เป็นแหล่งการทำนาย ดังนั้นแบบฝึกหัดนี้จึงให้คะแนนผู้คนอย่างชัดเจนถึงสิ่งที่พวกเขา ไม่ได้ มีชื่อเสียง นี่เป็นเหมือนการประเมินว่า “คนที่ชอบคิดเกี่ยวกับอนาคตทำการคาดการณ์ที่ดีหรือไม่” มากกว่าการประเมินว่า “นักพยากรณ์มืออาชีพหรือผู้เชี่ยวชาญคาดการณ์ได้ดีหรือไม่”
ด้วยเหตุผลที่ฉันกล่าวถึงใน ภาคผนวกด้านล่าง ฉันไม่ได้ขอให้ Arb พยายามระบุว่าบิ๊กทรีมีความมั่นใจเพียงใดเกี่ยวกับการคาดคะเนของพวกเขา ฉันสนใจว่าการคาดคะเนของพวกเขาไม่ชัดเจนหรือไม่ และบางครั้งก็ถูกต้อง มากกว่าว่าพวกเขา ตระหนักในตนเองเกี่ยวกับความไม่แน่นอนของตนเองหรือไม่ ฉันมองว่าสิ่งเหล่านี้เป็นประเด็นที่แตกต่างกัน และฉันสงสัยว่าบรรทัดฐานในอดีตทำให้สิ่งหลังท้อใจมากกว่าปกติในปัจจุบัน (อย่างน้อยก็ภายในชุมชนที่สนใจใน แนวความคิดแบบเบย์ และ ศาสตร์แห่งการพยากรณ์ )
รายละเอียดเพิ่มเติมใน รายงานของ Arb
ตัวเลข
ตารางด้านล่างสรุปตัวเลขที่ฉันคิดว่าให้ภาพระดับสูงที่ดีที่สุด ดู รายงานฉบับเต็ม และ ไฟล์รายละเอียด สำหรับการคาดคะเนดิบและการตัดอื่นๆ จำนวนหนึ่ง มีหลายวิธีที่คุณสามารถแบ่งข้อมูลได้ แต่ฉันไม่คิดว่ามันจะเปลี่ยนรูปภาพจากสิ่งที่ฉันให้ไว้ด้านล่าง
ด้านล่างนี้ ฉันนำเสนอประวัติของผู้ทำนายเกี่ยวกับ:
- “การคาดคะเนทั้งหมด”: การคาดคะเนที่แก้ไขได้ทั้งหมด 30 ปีหรือมากกว่านั้น 5 รายการรวมถึงการคาดการณ์ที่ Arb ต้องกรอกในกรอบเวลา
- “การคาดคะเนทางเทคนิค”: เช่นเดียวกับข้างต้น แต่จำกัดเฉพาะการคาดคะเนเกี่ยวกับความสามารถทางเทคโนโลยีโดยเฉพาะ (ตรงข้ามกับปฏิสัมพันธ์ทางเทคโนโลยี/เศรษฐกิจ หรือปฏิสัมพันธ์ทางเทคโนโลยี/วัฒนธรรม
- การคาดการณ์ “ยาก” กับ “ความยาก” 4/5 หรือ 5/5
- “ยาก + เทคโนโลยี + วันที่แน่นอน”: ชุดคำทำนายเล็กๆ ที่ตรงตามเกณฑ์ที่เข้มงวดที่สุด (เฉพาะเทคโนโลยี “ความแข็ง” 4/5 หรือ 5/5 แนบวันที่แน่นอน)
หมวดหมู่ | # ถูกต้อง | # ไม่ถูกต้อง | #คลุมเครือ/ใกล้พลาด | ถูกต้อง / (ถูก + ผิด) |
ทั้งหมดได้รับการแก้ไข คำทำนาย |
23 |
29 |
14 |
44.23% |
การคาดการณ์ทางเทคนิค |
11 |
4 |
8 |
73.33% |
การทำนายที่ยาก |
10 |
11 |
7 |
47.62% |
ยาก + เทคโนโลยี + วันที่แน่นอน |
5 |
1 |
4 |
83.33% |
คุณสามารถดูชุดการคาดคะเนทั้งหมดได้ ที่นี่ แต่เพื่อให้เห็นถึงรสชาติ นี่คือการคาดคะเนที่ “ถูกต้อง” สองรายการ และการคาดการณ์ที่ “ไม่ถูกต้อง” สองรายการจากหมวดหมู่ที่เข้มงวดที่สุด 6 ทั้งหมดนี้เป็นคำทำนายของอาซิมอฟในปี 2507 ประมาณปี 2557 (เว้นแต่จะระบุไว้เป็นอย่างอื่น)
- ถูกต้อง: “มีเพียงเรือไร้คนขับเท่านั้นที่จะลงจอดบนดาวอังคาร แม้ว่าจะมีการสำรวจด้วยมนุษย์” บิงโกและ IMO ที่น่าประทับใจ
- ถูกต้อง: “หน้าจอ [ของโทรศัพท์] ไม่เพียงใช้เพื่อดูคนที่คุณโทรหาเท่านั้น แต่ยังสามารถใช้เพื่อศึกษาเอกสารและรูปถ่ายและอ่านข้อความจากหนังสือ” ฉันรู้สึกว่านี่จะเป็นคำทำนายที่น่าประทับใจในปี 2547
- ไม่ถูกต้อง: “จะมีการเน้นมากขึ้นในการขนส่งที่ทำให้มีการสัมผัสกับพื้นผิวน้อยที่สุด แน่นอนว่าจะมีเครื่องบิน แต่การเดินทางภาคพื้นดินก็จะพาขึ้นไปในอากาศหนึ่งหรือสองฟุตจากพื้นดินมากขึ้น” ผิดมากที่ตอนนี้เราอ้างถึงสิ่งที่ไม่ได้วางเมาส์ไว้เป็น “hoverboards”
- ไม่ถูกต้อง: “ลูกบาศก์โปร่งใสจะทำให้รูปลักษณ์ของพวกเขาสามารถรับชมสามมิติได้ อันที่จริงนิทรรศการยอดนิยมชิ้นหนึ่งที่งาน World’s Fair 2014 จะเป็นทีวี 3 มิติที่สร้างขึ้นขนาดเท่าตัวจริงซึ่งการแสดงบัลเล่ต์จะ มองเห็นได้ ลูกบาศก์จะค่อยๆ หมุนดูจากทุกมุม” ดูเหมือนไม่ตลก แต่ดูเหมือนไม่ถูกต้อง แน่นอน ประเด็นข้างเคียงในที่นี้คือเขาหมายถึงงาน World’s Fair 2014 ซึ่ง ไม่เกิดขึ้น
ความท้าทายทั่วไปในการประเมินบันทึกการติดตามการคาดการณ์คือเราไม่รู้ว่าจะเปรียบเทียบประวัติของใครบางคนกับอะไร การคาดการณ์ของคุณถูกต้องประมาณครึ่งหนึ่ง “ดี” หรือไม่น่าประทับใจไปกว่าการเขียนสิ่งต่างๆ ที่อาจเกิดขึ้นและพลิกเหรียญในแต่ละข้อหรือไม่
ฉันคิดว่าสิ่งนี้มาจาก ความยากของการคาดคะเน ซึ่งยากต่อการประเมินอย่างเป็นระบบ สิ่งที่ดีเกี่ยวกับการศึกษานี้คือ มีการคาดการณ์เพียงพอที่จะได้ขนาดตัวอย่างที่เหมาะสม แต่สิ่งทั้งหมดมีเพียงพอที่คุณจะได้สัมผัสเชิงคุณภาพที่ดีสำหรับการคาดคะเนด้วยตัวมันเอง (นี่คือเหตุผลที่ฉันยกตัวอย่าง คุณสามารถดูการคาดคะเนทั้งหมดสำหรับบุคคลหนึ่ง ๆ ได้โดยคลิกที่ชื่อของพวกเขาเหนือตาราง) ในกรณีนี้ ฉันคิดว่าอาซิมอฟมีแนวโน้มที่จะทำนายที่ไม่ชัดเจนและมีรายละเอียด ซึ่งฉันคิดว่าน่าประทับใจ ได้รับ ~ ครึ่งหนึ่งถูกต้อง
หมวดหมู่ | # ถูกต้อง | # ไม่ถูกต้อง | #คลุมเครือ/ใกล้พลาด | ถูกต้อง / (ถูก + ผิด) |
คำทำนายทั้งหมด |
129 |
148 |
48 |
46.57% |
การคาดการณ์ทางเทคนิค |
85 |
82 |
29 |
50.90% |
การทำนายที่ยาก |
14 |
10 |
4 |
58.33% |
ยาก + เทคโนโลยี + วันที่แน่นอน |
6 |
5 |
2 |
54.55% |
ตัวอย่าง (ดังข้างบน): 7
- แก้ไขคำทำนายปี พ.ศ. 2507 เกี่ยวกับปี พ.ศ. 2543 ได้ถูกต้อง: “[ดาวเทียมสื่อสาร] จะทำให้โลกนี้เป็นโลกที่เราสามารถติดต่อกันได้ทันทีไม่ว่าเราจะอยู่ที่ใด ที่ซึ่งเราสามารถติดต่อเพื่อนของเราได้ทุกที่บนโลก ถึงแม้ว่าเราจะไม่ทราบความจริงของพวกเขา ตำแหน่งทางกายภาพ ในยุคนั้น อาจจะเพียงห้าสิบปีต่อจากนี้สำหรับ [บุคคล] ที่จะทำธุรกิจ [ของพวกเขา] จากตาฮิติหรือบาหลีเช่นเดียวกับ [พวกเขา] จากลอนดอน” (ฉันคิดว่า “ดำเนินธุรกิจ [ของพวกเขา]” หมายถึงการติดต่อทางธุรกิจมากกว่าการเรียกร้องแบบองค์รวมบางประเภทว่าไม่มีการสูญเสียประสิทธิภาพการทำงานจากการทำงานระยะไกล)
- ถูกต้องตามคำทำนายในปี พ.ศ. 2493 ประมาณปี พ.ศ. 2543: “แท้จริงแล้ว อาจสันนิษฐานได้ค่อนข้างแน่นอนว่าการลาดตระเวนครั้งแรกของดาวเคราะห์จะเป็นการโคจรรอบจรวดซึ่งไม่ได้พยายามจะลงจอด เครื่องจักรไร้คนขับที่ใช้แล้วทิ้งอาจใช้การวัดระยะทางและโทรทัศน์อย่างประณีต” ดูเหมือนจะไม่ใช่คำทำนายที่เฉียบขาด การคาดคะเนที่ถูกต้องจำนวนมากของเขามีรสนิยมทั่วไปที่จะบอกว่าความคืบหน้าจะไม่น่าตื่นเต้น เกินไป และฉันพบว่าสิ่งเหล่านี้น่าประทับใจน้อยกว่าการคาดการณ์ที่ถูกต้องของ Asimov ส่วนใหญ่
- การคาดการณ์ที่ไม่ถูกต้องในปี พ.ศ. 2503 เมื่อปี พ.ศ. 2553 “ใครๆ ก็นึกภาพออกว่าก่อนสิ้นศตวรรษนี้ โรงงานขนาดใหญ่ขนาดใหญ่ที่ใช้พลังงานราคาถูกจากเครื่องปฏิกรณ์นิวเคลียร์แสนสาหัสเพื่อสกัดน้ำบริสุทธิ์ เกลือ แมกนีเซียม โบรมีน สตรอนเทียม รูบิเดียม ทองแดง และโลหะอื่นๆ อีกมาก จากทะเล ข้อยกเว้นที่โดดเด่นจากรายการคือ เหล็ก ซึ่งหาได้ยากในมหาสมุทรมากกว่าในทวีปต่างๆ “
- การทำนายปี 1949 ที่ไม่ถูกต้องเกี่ยวกับปี 1983: “ก่อนที่เรื่องนี้จะโตเป็นสองเท่าของอายุปัจจุบัน เราจะมีนักสำรวจหุ่นยนต์กระจายอยู่ทั่วดาวอังคาร”
โดยทั่วไปแล้วฉันพบว่าชุดข้อมูลนี้น่าพึงพอใจ/เป็นการศึกษาน้อยกว่าของ Asimov: การคาดคะเนจำนวนมากนั้นค่อนข้างลึกซึ้งในวัชพืชว่าจรวดทำงานอย่างไรหรืออะไรทำนองนั้น และส่วนมากก็ค่อนข้างยากที่จะตีความ/ให้คะแนน ฉันคิดว่าการคาดคะเนที่แย่นั้นค่อนข้างแย่ และบางครั้งการคาดคะเนที่ดีนั้นก็ดี แต่โดยทั่วไปแล้วน่าประทับใจน้อยกว่าของอาซิมอฟ
หมวดหมู่ | # ถูกต้อง | # ไม่ถูกต้อง | #คลุมเครือ/ใกล้พลาด | ถูกต้อง / (ถูก + ผิด) |
คำทำนายทั้งหมด |
19 |
41 |
7 |
31.67% |
การคาดการณ์ทางเทคนิค |
14 |
20 |
6 |
41.18% |
การทำนายที่ยาก |
1 |
16 |
1 |
5.88% |
ยาก + เทคโนโลยี + วันที่แน่นอน |
0 |
1 |
1 |
0.00% |
สิ่งนี้ดูแย่มาก โดยเฉพาะอย่างยิ่งเมื่อปรับตามความยาก: สิ่งที่ “ถูกต้อง” หลายๆ อย่างดูเหมือนจะตีความยากหรือชัดเจนมาก (เช่น ไม่ต้องเดินทางข้ามเวลา) ฉันรู้สึกประทับใจกับคำทำนายของเขาที่ว่า “เราอาจจะยังคงรักษาไข้หวัดธรรมดาอยู่” จนกระทั่งฉันเห็นคำทำนายในแหล่งที่แยกต่างหากว่า “มะเร็ง ไข้หวัด และฟันผุทั้งหมดจะถูกพิชิต” โดยรวมแล้ว ดูเหมือนว่าเขาได้ทำนายเรื่องแปลก ๆ มากมายเกี่ยวกับการเดินทางในอวกาศ และจากนั้นก็คาดเดาสิ่งที่ไม่น่าจะเป็นไปได้ (เช่น ไม่ต้องเดินทางข้ามเวลา)
เขามีสิ่งที่ดีบางอย่างเช่น: “ภายในปี 2000 AD เราจะรู้อย่างมากเกี่ยวกับการทำงานของสมอง … ในขณะที่ในปี 1900 เรารู้เพียงเล็กน้อยว่าผิด ฉันไม่ได้ทำนายว่าความลึกลับพื้นฐานของจิตวิทยา — การที่มวลที่จัดเรียงในรูปแบบที่ซับซ้อนบางอย่างจะรับรู้ได้อย่างไร — จะได้รับการแก้ไขภายในปี ค.ศ. 2000 ฉันหวังว่าจะเป็นอย่างนั้น แต่อย่าคาดหวังเลย” เขายังทำนายว่ามนุษย์จะไม่มีการสูญพันธุ์และไม่มีวันสิ้นสุดของสงคราม – ฉันเดาว่าคนจำนวนมากไม่เห็นด้วยกับสิ่งเหล่านี้ในขณะนั้น
ภาพรวม
ดูเหมือนว่าใน “บิ๊กทรี” เรามี:
- หนึ่ง (อาซิมอฟ) ที่ดูค่อนข้างน่าประทับใจ – พลาดมากมาย แต่อัตราการโจมตี 50% จากการคาดคะเนที่ไม่ชัดเจนนั้นดูดีมาก
- หนึ่ง (ไฮน์ไลน์) ที่ดูไม่จริงจังและไม่ถูกต้อง
- คนหนึ่ง (คลาร์ก) ที่ตัดสินค่อนข้างยาก แต่โดยรวมแล้วดูค่อนข้างแข็งแกร่ง (ประมาณครึ่งหนึ่งของการคาดการณ์ของเขาดูเหมือนจะถูกต้อง
อนาคตของวันนี้กับการคาดการณ์เหล่านี้
ข้อมูลข้างต้นรวบรวมการคาดการณ์แบบไม่เป็นทางการ – ไม่มีการให้ความน่าจะเป็น การให้เหตุผลเพียงเล็กน้อยหรือไม่มีเลย ไม่มีความพยายามที่ชัดเจนในการรวบรวมหลักฐานและชั่งน้ำหนักข้อโต้แย้ง – โดยนักเขียนนิยายมืออาชีพ
เปรียบเทียบสถานการณ์นี้กับสรุป บรรทัดต่างๆ ของการคาดการณ์การให้เหตุผลเพื่อคาดการณ์ AI ที่ก่อให้เกิดการเปลี่ยนแปลง หลังรวมถึง:
- การสำรวจอย่างเป็นระบบที่รวบรวมความคิดเห็นจากนักวิจัย AI หลายร้อยคน
- รายงานว่าพนักงาน Open Philanthropy ใช้เวลาหลายพันชั่วโมงในการนำเสนอหลักฐานและพิจารณาข้อโต้แย้งและข้อโต้แย้งอย่างเป็นระบบ
- ความพยายามอย่างจริงจังที่จะใช้ประโยชน์จาก วรรณกรรมที่พึ่งเกิดขึ้นใหม่เกี่ยวกับวิธีการทำนายที่ดี เช่น ผู้เขียน (และฉัน) ได้ ทำการฝึกอบรมการสอบเทียบ โดยทั่วไป 8 และพยายามใช้ภาษาของความน่าจะเป็นเพื่อระบุถึงความไม่แน่นอนของเรา
มีพื้นที่มากมายสำหรับการอภิปรายว่าควรคาดหวังให้มาตรการเหล่านี้มากน้อยเพียงใดเพื่อปรับปรุงการมองการณ์ไกลของเรา เมื่อเทียบกับสิ่งที่ “บิ๊กทรี” ทำ ฉันเดาว่าเราควรจะ คาดการณ์เกี่ยวกับ AI ที่เปลี่ยนแปลง ได้อย่างจริงจังมากขึ้น ส่วนหนึ่งเป็นเพราะฉันคิดว่ามีความแตกต่างใหญ่ระหว่าง “ความพยายามเพียงเล็กน้อย” (โดยทั่วไปแล้วคาดเดานอกกรอบโดยไม่ต้องตรวจสอบข้อโต้แย้งและข้อโต้แย้งอย่างจริงจังซึ่งก็คือ ความประทับใจของฉันต่อสิ่งที่บิ๊กทรีส่วนใหญ่ทำ) และ “ใช้ความพยายามในระดับปานกลาง” (พิจารณาความคิดเห็นของผู้เชี่ยวชาญ การสำรวจข้อโต้แย้ง และข้อโต้แย้ง การคิดอย่างชัดเจนเกี่ยวกับระดับของความไม่แน่นอนของตนเอง)
แต่เวอร์ชัน “ใช้ความพยายามเพียงเล็กน้อย” ก็ไม่ได้ดูแย่ขนาดนั้น
หากคุณดูการคาดการณ์เกี่ยวกับ AI ที่เปลี่ยนแปลงและคิดว่า “บางทีนี่อาจเป็นการคาดคะเนของ Asimov-ish ที่มีอัตราการเข้าชมประมาณ 50% สำหรับคำถามที่ยาก บางทีนี่อาจเป็นการคาดคะเนของ Heinlein-ish ที่พื้นๆ ไร้สาระ” ซึ่งยังดูดีพอที่จะรับได้ สมมติฐาน ” ศตวรรษที่สำคัญที่สุด ” อย่างจริงจัง
ภาคผนวก: การศึกษาอื่น ๆ เกี่ยวกับประวัติของลัทธิอนาคตนิยม
โปรเจ็ก ต์ปี 2013 ประเมินการคาดการณ์ในปี 1999 ของ Ray Kurzweil เกี่ยวกับปี 2009 และการติดตามในปี 2020 ประเมิน การคาดการณ์ในปี 1999 ของเขาในปี 2019 Kurzweil ขึ้นชื่อว่ามีความ น่าสนใจในขณะนั้น มากกว่าที่จะ เข้าใจถึงปัญหาย้อนหลัง และมีการพบและให้คะแนนการคาดคะเนจำนวนมาก ดังนั้นฉันจึงถือว่าการศึกษานี้มีข้อได้เปรียบที่คล้ายคลึงกันกับการศึกษาข้างต้น
- การคาดคะเนชุดแรก (ประมาณปี พ.ศ. 2552 ซึ่งเป็นช่วง 10 ปี) มีการคาดคะเนที่ “จริงหรือจริงเล็กน้อย” มากเท่ากับการคาดคะเน “เท็จหรือเท็จเพียงเล็กน้อย”
- ครั้งที่สอง (ประมาณปี 2019 ซึ่งเป็นช่วง 20 ปี) เลวร้ายกว่ามาก โดย 52% ของการคาดการณ์เป็น “เท็จ” และ “เท็จหรือเท็จเล็กน้อย” อย่างตรงไปตรงมา ซึ่งมากกว่าการคาดการณ์ที่ “จริงหรือจริงเพียงเล็กน้อย” เกือบ 3 ต่อ 1
Kurzweil ขึ้นชื่อในเรื่องการคาดการณ์ที่กล้าหาญและขัดแย้งของเขา และโดยรวมแล้วฉันมีแนวโน้มที่จะเรียกประวัติของเขาว่า “ปานกลาง” และ “ดี” – โดยรวมแล้วก้าวร้าวเกินไป แต่มีเพลงฮิตที่โดดเด่นอยู่บ้าง (ฉันคิดว่าถ้าสมมติฐาน ที่สำคัญที่สุดของศตวรรษ กลายเป็นจริง เขาจะดูมีความเข้าใจในวงกว้างมาก แค่ช่วงแรกๆ หากไม่เป็นเช่นนั้น เขาจะดูไร้เหตุผลในวงกว้าง แต่นั่นคือ TBD)
กระดาษปี 2002 ซึ่งสรุปโดย Luke Muehlhauser ที่นี่ ได้ประเมินประวัติของ ปี 2000 โดย Herman Kahn และ Anthony Wiener “หนึ่งในผลิตภัณฑ์ที่มีชื่อเสียงและเป็นที่เคารพนับถือที่สุดของนักอนาคตนิยมมืออาชีพ”
- ประมาณ 45% ของการคาดการณ์ได้รับการตัดสินว่าแม่นยำ
- ลุคสรุปว่าคาห์นและวีเนอร์มั่นใจมากเกินไป เพราะเขาตีความว่าพวกเขาเป็นการทำนายด้วยความมั่นใจ 90-95%
- Takeaway ของฉันแตกต่างกันเล็กน้อย ฉันเห็นหัวข้อที่เกิดซ้ำซึ่งผู้คนมักจะได้รับอัตราการเข้าชม 40-50% จากการคาดการณ์ที่น่าสนใจเกี่ยวกับอนาคต แต่บางครั้งนำเสนอการคาดคะเนเหล่านี้ด้วยความมั่นใจอย่างยิ่ง (ซึ่งทำให้ดูโง่)
- ฉันคิดว่าเราสามารถแยก “ผู้พยากรณ์ในอดีตมั่นใจมากเกินไป” (ซึ่งฉันสงสัยว่าส่วนหนึ่งเป็นเพราะการ แสดงออกที่ชัดเจนและการหาปริมาณของความไม่แน่นอน เป็นเรื่องผิดปกติและ/หรือท้อแท้ในบริบทที่เกี่ยวข้อง) จาก “ผู้พยากรณ์ในอดีตไม่สามารถคาดการณ์ที่น่าสนใจที่มีเหตุผลได้ มีแนวโน้มที่จะถูกต้อง” อดีตดูเหมือนจริงสำหรับฉัน แต่อย่างหลังไม่
แบบสำรวจของลุคในปี 2019 เกี่ยวกับประวัติลัทธิอนาคตนิยม ระบุเอกสารที่เกี่ยวข้องอีกสองฉบับ ( ที่นี่ และ ที่นี่ ); ฉันไม่ได้อ่านสิ่งเหล่านี้นอกเหนือจากบทคัดย่อ แต่อัตราความแม่นยำโดยรวมคือ 76% และ 37% ตามลำดับ เป็นการยากที่จะตีความตัวเลขเหล่านั้นโดยไม่ได้รู้สึกว่าการทำนายนั้นท้าทายเพียงใด
โพสต์ในฟอรัม EA ปี 2021 ดูที่บันทึกการติดตามรวมของผู้พยากรณ์ใน PredictionBook และ Metaculus รวมถึงการวิเคราะห์เฉพาะของการคาดการณ์ 5 ปีขึ้นไป แม้ว่าฉันจะไม่พบว่าง่ายที่จะสรุปว่าประสิทธิภาพนั้น “ดี” หรือ “แย่” ” (หรือคำถามที่คล้ายกับคำถามที่ฉันสนใจ)
เชิงอรรถ
-
การเปิดเผยข้อมูล: ฉันเป็นซีอีโอร่วมของ Open Philanthropy
- ฉันยัง Googled สั้น ๆ สำหรับการคาดคะเนของพวกเขาเพื่อให้ได้รับความรู้สึกเบื้องต้นว่าพวกเขาเป็นประเภทของการคาดการณ์ที่เกี่ยวข้องหรือไม่ ฉันพบบทความสองสามบทความที่แสดงตัวอย่างการคาดคะเนที่ดีและไม่ดี แต่ไม่มีสิ่งใดที่เป็นระบบ ฉันอ้างว่าฉันไม่ได้ออกกำลังกายแบบนี้กับคนอื่นและโยนมันทิ้งไป ↩
- นั่นคือถ้าเราไม่มีมีมอยู่เบื้องหลังว่ายากแค่ไหนที่จะทำนายอนาคต ↩
-
1 – เป็นที่รู้จักโดยทั่วไปแล้ว
2 – เป็นฉันทามติของผู้เชี่ยวชาญ
3 – เก็งกำไร แต่มีแนวโน้ม
4 – เหนือเทรนด์ หรือมีรายละเอียดที่แปลกประหลาด
5 – เฉียบขาด ไม่ตกเทรนด์ ↩
-
การคาดการณ์ในชุดข้อมูลน้อยมากนั้นมีอายุน้อยกว่า 30 ปี และฉันก็แค่เพิกเฉย
- อาซิมอฟมีเพียงหนึ่งการทำนายที่ไม่ถูกต้องในหมวดหมู่นี้ ดังนั้นสำหรับคำทำนายที่ไม่ถูกต้องครั้งที่ 2 ฉันจึงใช้คำที่มีปัญหา “3” แทน “4” ↩
- คำทำนายแรกในรายการนี้เข้าเกณฑ์เกณฑ์ที่เคร่งครัดที่สุดเมื่อผมร่างบทความนี้ขึ้นเป็นครั้งแรก แต่ตอนนี้ถูกปรับเป็นระดับความยาก=3/5 ซึ่งผมไม่เห็นด้วย (ผมคิดว่าเป็นการคาดคะเนที่ประทับใจมาก มากกว่าที่เหลือ ที่มีคุณสมบัติตามความยาก=4/5) ↩
- ดู รายงานนี้ เกี่ยวกับการสอบเทียบสำหรับผู้ตรวจสอบทุน Open Philanthropy (แม้ว่าจะเป็นกลุ่มคนที่แตกต่างจากผู้ที่ค้นคว้าเกี่ยวกับไทม์ไลน์ AI ที่เปลี่ยนแปลง) ↩