บันทึกการติดตามของนักอนาคตดูเหมือน … สบายดี

บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี

คลิกขวาล่างเพื่อดาวน์โหลดหรือค้นหาใน Apple Podcasts, Spotify, Stitcher เป็นต้น

ฉันได้โต้แย้งว่าการพัฒนา AI ขั้นสูงสามารถทำให้ศตวรรษนี้กลายเป็น ศตวรรษที่สำคัญที่สุด สำหรับมนุษยชาติ ปฏิกิริยาทั่วไปต่อแนวคิด นี้ คือความเห็นโดย Tyler Cowen ว่า “นักคิดในอดีตสามารถทำนายอนาคตได้ดีเพียงใด อย่าเลือกเพียงแค่คนที่โด่งดังเพราะพวกเขามีสิ่งที่ยิ่งใหญ่ที่ถูกต้อง”

นี่เป็นเหตุผลทั่วไปที่ผู้คนมักสงสัยเกี่ยวกับ ศตวรรษที่สำคัญที่สุด และบ่อยครั้งสำหรับความกังขาเกี่ยวกับความพยายามใน ลัทธิอนาคต (พยายามทำนายเหตุการณ์สำคัญในโลกนี้เป็นเวลานาน) หรือการ บังคับทิศทาง โลกนำทางเหตุการณ์สำคัญในอนาคตดังกล่าว)

แนวความคิดนี้มีลักษณะดังนี้: “แม้ว่าเราจะไม่สามารถระบุจุดอ่อนเฉพาะใน การโต้แย้ง เกี่ยวกับเหตุการณ์สำคัญในอนาคตได้ บางทีเราควรสงสัยในความสามารถของเราเองที่จะพูดอะไรที่มีความหมายเกี่ยวกับอนาคตในระยะยาว ดังนั้นบางทีเรา ควรลืมเกี่ยวกับทฤษฎีแห่งอนาคต และมุ่งไปที่การลดความทุกข์ในปัจจุบัน โดยทั่วไปจะเพิ่มขีดความสามารถของมนุษย์ เป็นต้น”

แต่โดย ทั่วไป แล้วผู้คนมักคาดเดาเหตุการณ์ในอนาคตได้ไม่ดีหรือไม่? รวมถึงคนช่างคิดที่พยายามอย่างหนักพอสมควรที่จะเป็นฝ่ายถูก? หากเรามองย้อนกลับไปที่คำทำนายของนักอนาคตที่มีชื่อเสียง ประวัติที่แท้จริงเป็นอย่างไร สถานการณ์เลวร้ายแค่ไหน?

ฉันได้ดูค่อนข้างไกลและกว้างสำหรับคำตอบที่ เป็นระบบ สำหรับคำถามนี้และ 1 Luke Muehlhauser ของ Open Philanthropy ได้ใช้ความพยายามพอสมควรในการค้นคว้า ฉันพูดถึงสิ่งที่เราพบใน ภาคผนวก จนถึงตอนนี้ เรายังไม่พบมากทั้งหมด – ข้อสังเกตหลักคือ เป็นการยากที่จะตัดสินประวัติของนักอนาคตนิยม (ลุคพูดถึงความยากลำบาก ที่นี่ )

เมื่อเร็ว ๆ นี้ ฉันได้ทำงานร่วมกับ Gavin Leech และ Misha Yagudin ที่ Arb Research เพื่อแก้ไขปัญหานี้อีกครั้ง ฉันพยายามทำให้สิ่งต่าง ๆ ง่ายกว่าความพยายามในอดีต – เพื่อดูนักอนาคตในอนาคตสองสามคนที่ (a) ทำนายสิ่งต่าง ๆ “คล้าย” ความก้าวหน้าใน AI (แทนที่จะเช่นการทำนายแนวโน้มของประชากรโลก); (b) อาจคิดอย่างมีเหตุผลเกี่ยวกับเรื่องนี้ แต่ (c) ไม่ชัดเจนนัก “เลือกเฉพาะคนที่มีชื่อเสียงเพราะพวกเขามีสิ่งที่ถูกต้อง” ดังนั้นฉันจึงขอให้ Arb ดู คำทำนายของนักเขียนนิยายวิทยาศาสตร์ “บิ๊กทรี” ในช่วงกลางศตวรรษที่ 20 ได้แก่ Isaac Asimov, Arthur C. Clarke และ Robert Heinlein

คนเหล่านี้เป็นคนที่คิดมากเกี่ยวกับวิทยาศาสตร์และอนาคต และคาดการณ์มากมายเกี่ยวกับเทคโนโลยีในอนาคต แต่พวกเขามีชื่อเสียงในด้าน ความบันเทิงในนิยายของพวกเขาในเวลา นั้น ไม่ใช่ว่าการทำนายสารคดีของพวกเขาจะดูดีเพียงใดในการมองย้อนกลับไป ฉันเลือกพวกเขาโดยจำได้คร่าวๆ ว่า “สามยักษ์ใหญ่แห่งนิยายวิทยาศาสตร์” เป็นสิ่งที่ผู้คนพูดกันในบางครั้ง ใช้กูเกิลและไปกับใครที่มา – ไม่ต้องตามล่าหานักเขียนแนวไซไฟจำนวนมากและเลือกสิ่งที่ดีที่สุดหรือแย่ที่สุด 2

ดังนั้น ฉันคิดว่าประวัติการทำงานของพวกเขาควรให้ความรู้สึกที่ดีแก่เราสำหรับ “สิ่งที่คาดหวังจากผู้ที่ไม่ใช่มืออาชีพ ผู้เชี่ยวชาญ หรือนักพยากรณ์ที่โชคดีอย่างเห็นได้ชัด แต่กำลังพยายามใช้ความคิดอย่างมีเหตุผล” ตามที่ฉันจะอธิบาย ด้านล่าง ฉันคิดว่านี่เป็นวิธีที่ “ไม่ยุติธรรม” หลายวิธีเมื่อเปรียบเทียบกับการคาดการณ์ในปัจจุบันเกี่ยวกับ AI: ฉันคิดว่าการคาดการณ์เหล่านี้ไม่จริงจังมากนัก พิจารณาให้รอบคอบน้อยกว่า และเกี่ยวข้องกับงานน้อยลง (โดยเฉพาะงานที่ชั่งน้ำหนักผู้คนและข้อโต้แย้งที่แตกต่างกัน กันและกัน).

แต่สิ่งที่ฉันทำได้คือ บันทึกการติดตามของพวกเขาดู … ดี! พวกเขาทำการคาดการณ์ที่ละเอียดและไม่ชัดเจนเกี่ยวกับอนาคตระยะยาว (30+ มักจะ 50+ ปี); ผลลัพธ์มีตั้งแต่ “น่าประทับใจมาก” (อาซิมอฟมีสิทธิ์ประมาณครึ่งหนึ่งโดยคาดการณ์ที่ดูเหมือนไม่ชัดเจน) ถึง “แย่” (ไฮน์ไลน์เกือบ 35% และการโจมตีของเขาดูไม่ค่อยดี) ถึง “ที่ไหนสักแห่งในระหว่าง ” (คลาร์กมีอัตราการโจมตีที่ใกล้เคียงกับอาซิมอฟ แต่การคาดการณ์ที่ถูกต้องของเขาดูไม่น่าประทับใจเท่าไหร่) มีการคาดคะเนที่ดูน่าประทับใจและน่าอายมากมาย

(เราจะกำหนดระดับความแม่นยำได้อย่างไรว่า “ดี” กับ “แย่” โชคไม่ดีที่ไม่มีเกณฑ์เปรียบเทียบเชิงปริมาณที่ชัดเจน – ฉันคิดว่าเราแค่ต้องดูการคาดคะเนด้วยตัวเองว่ามันยากแค่ไหน / คล้ายกับคำทำนายของวันนี้อย่างไร AI และทำการตัดสิน ฉันสามารถจินตนาการได้อย่างง่ายดายว่าคนอื่นมีการตีความที่แตกต่างจากของฉัน นั่นคือเหตุผลที่ฉันยกตัวอย่างและเชื่อมโยงไปยังชุดการทำนายทั้งหมด ฉันพูดถึงสิ่งนี้เพิ่มเติม ด้านล่าง )

พวกเขาไม่ใช่นักพยากรณ์ที่ผิดพลาด แต่ก็ไม่ได้สุ่มสี่สุ่มห้าเกี่ยวกับเรื่องนี้ (บางทีไฮน์ไลน์อาจเป็น) โดยรวมแล้ว ฉันคิดว่าคุณสามารถเรียกพวกเขาว่า “ธรรมดา” แต่คุณไม่สามารถเรียกพวกเขาว่า “สิ้นหวัง” หรือ “ไร้เงื่อนงำ” หรือ “สัญญาณเตือนแก่ทุกคนที่กล้าทำนายอนาคตในระยะยาวไม่ได้ ” โดยรวมแล้ว ฉันคิดว่าพวกเขาทำอย่างนั้นและคุณอาจไร้เดียงสา 3 เดาว่าคนที่มีไหวพริบดีจะทำอะไรโดยบังเอิญที่พวกเขาพยายามทำ?

ด้านล่าง ฉันจะ:

  • สรุป ประวัติผลงานของอาซิมอฟ คลาร์ก และไฮน์ไลน์ พร้อมเชื่อมโยงไปยังรายงานฉบับสมบูรณ์ของ Arb
  • แสดงความคิดเห็น ว่าทำไมฉันถึงคิดว่า การคาดคะเนที่สำคัญเกี่ยวกับ AI ที่เปลี่ยนแปลง ได้น่าจะเป็นเดิมพันที่ดีกว่าการคาดการณ์ของ Asimov/Clarke/Heinlein แม้ว่าในท้ายที่สุดแล้ว หากเป็นเพียง “การเดิมพันที่ดีพอๆ กัน” ฉันคิดว่ามันเพียงพอแล้วที่จะสนับสนุนกรณีของฉันที่เราควรจะจ่าย ให้ความสนใจกับสมมติฐาน “ศตวรรษที่สำคัญที่สุด” มาก ขึ้น
  • สรุปงานวิจัยอื่นๆ ที่มีอยู่เกี่ยวกับประวัติของนักอนาคตนิยม ซึ่งฉันคิดว่าสอดคล้องกับแนวคิดนี้ในวงกว้าง (แต่ส่วนใหญ่คลุมเครือ)

สำหรับการตรวจสอบนี้ Arb ได้ขุดค้นแหล่งข้อมูลเก่าหลายๆ แหล่งอย่างรวดเร็ว (ในเวลาประมาณ 8 สัปดาห์) ใช้การจับคู่รูปแบบและความพยายามด้วยตนเองเพื่อค้นหาการคาดการณ์ และทำงานร่วมกับผู้รับเหมาเพื่อทำคะแนนจากการคาดการณ์หลายร้อยรายการที่พวกเขาพบ ขอบคุณมากสำหรับพวกเขา! รายงานฉบับเต็มของพวกเขาอยู่ ที่นี่ หมายเหตุเล็กน้อยนี้: “หากคุณพบเห็นบางอย่างผิดปกติ เราจะจ่ายเงิน $5 ต่อเซลล์ที่เราอัปเดตตามผลลัพธ์ เราจะเพิ่มคำวิจารณ์ทั้งหมดที่เราเห็นด้วยและอัปเดตหรือปฏิเสธในเอกสารนี้เพื่อความโปร่งใส”

ประวัติผลงาน “บิ๊กทรี”

สรุปอย่างรวดเร็วว่า Arb สร้างชุดข้อมูลอย่างไร

Arb รวบรวม “สำเนาดิจิทัลของสารคดี [ของอาซิมอฟ, คลาร์ก, ไฮน์ไลน์] ให้มากที่สุดเท่าที่จะเป็นไปได้ (หนังสือ เรียงความ บทสัมภาษณ์) ผลที่ได้คือ 475 ไฟล์ครอบคลุม ~ 33% ของศพที่ไม่ใช่นิยาย”

จากนั้น Arb ใช้การจับคู่รูปแบบและการตรวจสอบด้วยตนเองเพื่อดึงการคาดคะเนทั้งหมดที่หาพบ และทำคะแนนการคาดการณ์เหล่านี้โดย:

  • ปรากฏว่าคำทำนายนั้นอยู่ห่างออกไปกี่ปี (ส่วนใหญ่ไม่ได้แนบวันที่ที่ชัดเจน ในกรณีเหล่านี้ Arb มักจะเติมขอบฟ้าเวลาเฉลี่ยสำหรับการคาดการณ์จากผู้เขียน คน เดียวกันซึ่งมีวันที่ชัดเจนที่แนบมาด้วย)
  • ไม่ว่าการคาดคะเนจะปรากฏว่าถูกต้อง ไม่ถูกต้อง หรือคลุมเครือหรือไม่ (ฉันไม่ได้เห็นด้วยกับการให้คะแนนเหล่านี้เสมอไป แต่โดยทั่วไปแล้วฉันรู้สึกว่าการคาดคะเนที่ “ถูกต้อง” อย่างน้อยก็ดู “น่าประทับใจและไม่งี่เง่า” ในขณะที่การคาดการณ์ที่ “ไม่ถูกต้อง” อย่างน้อยก็ดู “เสี่ยง”)
  • การคาดคะเนเป็นการคาดการณ์ล้วนๆ เกี่ยวกับสิ่งที่เทคโนโลยีสามารถทำได้ (เกี่ยวข้องมากที่สุด) การคาดการณ์เกี่ยวกับปฏิสัมพันธ์ของเทคโนโลยีและเศรษฐกิจ (ปานกลาง) หรือการคาดการณ์เกี่ยวกับปฏิสัมพันธ์ของเทคโนโลยีและวัฒนธรรม (มีความเกี่ยวข้องน้อยที่สุด) การคาดการณ์ที่ไม่มีผลกระทบต่อเทคโนโลยีลดลง
  • การทำนาย “ยาก” เพียงใด (นั่นคือผู้ทำคะแนนเดาว่ามันแตกต่างจากภูมิปัญญาดั้งเดิมหรือ “สิ่งที่ชัดเจน” ในขณะนั้นมากเพียงใด – รายละเอียดในเชิงอรรถ 4 )

ที่สำคัญ นิยายไม่เคยถูกใช้เป็นแหล่งการทำนาย ดังนั้นแบบฝึกหัดนี้จึงให้คะแนนผู้คนอย่างชัดเจนถึงสิ่งที่พวกเขา ไม่ได้ มีชื่อเสียง นี่เป็นเหมือนการประเมินว่า “คนที่ชอบคิดเกี่ยวกับอนาคตทำการคาดการณ์ที่ดีหรือไม่” มากกว่าการประเมินว่า “นักพยากรณ์มืออาชีพหรือผู้เชี่ยวชาญคาดการณ์ได้ดีหรือไม่”

ด้วยเหตุผลที่ฉันกล่าวถึงใน ภาคผนวกด้านล่าง ฉันไม่ได้ขอให้ Arb พยายามระบุว่าบิ๊กทรีมีความมั่นใจเพียงใดเกี่ยวกับการคาดคะเนของพวกเขา ฉันสนใจว่าการคาดคะเนของพวกเขาไม่ชัดเจนหรือไม่ และบางครั้งก็ถูกต้อง มากกว่าว่าพวกเขา ตระหนักในตนเองเกี่ยวกับความไม่แน่นอนของตนเองหรือไม่ ฉันมองว่าสิ่งเหล่านี้เป็นประเด็นที่แตกต่างกัน และฉันสงสัยว่าบรรทัดฐานในอดีตทำให้สิ่งหลังท้อใจมากกว่าปกติในปัจจุบัน (อย่างน้อยก็ภายในชุมชนที่สนใจใน แนวความคิดแบบเบย์ และ ศาสตร์แห่งการพยากรณ์ )

รายละเอียดเพิ่มเติมใน รายงานของ Arb

ตัวเลข

ตารางด้านล่างสรุปตัวเลขที่ฉันคิดว่าให้ภาพระดับสูงที่ดีที่สุด ดู รายงานฉบับเต็ม และ ไฟล์รายละเอียด สำหรับการคาดคะเนดิบและการตัดอื่นๆ จำนวนหนึ่ง มีหลายวิธีที่คุณสามารถแบ่งข้อมูลได้ แต่ฉันไม่คิดว่ามันจะเปลี่ยนรูปภาพจากสิ่งที่ฉันให้ไว้ด้านล่าง

ด้านล่างนี้ ฉันนำเสนอประวัติของผู้ทำนายเกี่ยวกับ:

  • “การคาดคะเนทั้งหมด”: การคาดคะเนที่แก้ไขได้ทั้งหมด 30 ปีหรือมากกว่านั้น 5 รายการรวมถึงการคาดการณ์ที่ Arb ต้องกรอกในกรอบเวลา
  • “การคาดคะเนทางเทคนิค”: เช่นเดียวกับข้างต้น แต่จำกัดเฉพาะการคาดคะเนเกี่ยวกับความสามารถทางเทคโนโลยีโดยเฉพาะ (ตรงข้ามกับปฏิสัมพันธ์ทางเทคโนโลยี/เศรษฐกิจ หรือปฏิสัมพันธ์ทางเทคโนโลยี/วัฒนธรรม
  • การคาดการณ์ “ยาก” กับ “ความยาก” 4/5 หรือ 5/5
  • “ยาก + เทคโนโลยี + วันที่แน่นอน”: ชุดคำทำนายเล็กๆ ที่ตรงตามเกณฑ์ที่เข้มงวดที่สุด (เฉพาะเทคโนโลยี “ความแข็ง” 4/5 หรือ 5/5 แนบวันที่แน่นอน)

อาซิมอฟ

หมวดหมู่ # ถูกต้อง # ไม่ถูกต้อง #คลุมเครือ/ใกล้พลาด ถูกต้อง / (ถูก + ผิด)
ทั้งหมดได้รับการแก้ไข
คำทำนาย

23

29

14

44.23%

การคาดการณ์ทางเทคนิค

11

4

8

73.33%

การทำนายที่ยาก

10

11

7

47.62%

ยาก + เทคโนโลยี + วันที่แน่นอน

5

1

4

83.33%

คุณสามารถดูชุดการคาดคะเนทั้งหมดได้ ที่นี่ แต่เพื่อให้เห็นถึงรสชาติ นี่คือการคาดคะเนที่ “ถูกต้อง” สองรายการ และการคาดการณ์ที่ “ไม่ถูกต้อง” สองรายการจากหมวดหมู่ที่เข้มงวดที่สุด 6 ทั้งหมดนี้เป็นคำทำนายของอาซิมอฟในปี 2507 ประมาณปี 2557 (เว้นแต่จะระบุไว้เป็นอย่างอื่น)

  • ถูกต้อง: “มีเพียงเรือไร้คนขับเท่านั้นที่จะลงจอดบนดาวอังคาร แม้ว่าจะมีการสำรวจด้วยมนุษย์” บิงโกและ IMO ที่น่าประทับใจ
  • ถูกต้อง: “หน้าจอ [ของโทรศัพท์] ไม่เพียงใช้เพื่อดูคนที่คุณโทรหาเท่านั้น แต่ยังสามารถใช้เพื่อศึกษาเอกสารและรูปถ่ายและอ่านข้อความจากหนังสือ” ฉันรู้สึกว่านี่จะเป็นคำทำนายที่น่าประทับใจในปี 2547
  • ไม่ถูกต้อง: “จะมีการเน้นมากขึ้นในการขนส่งที่ทำให้มีการสัมผัสกับพื้นผิวน้อยที่สุด แน่นอนว่าจะมีเครื่องบิน แต่การเดินทางภาคพื้นดินก็จะพาขึ้นไปในอากาศหนึ่งหรือสองฟุตจากพื้นดินมากขึ้น” ผิดมากที่ตอนนี้เราอ้างถึงสิ่งที่ไม่ได้วางเมาส์ไว้เป็น “hoverboards”
  • ไม่ถูกต้อง: “ลูกบาศก์โปร่งใสจะทำให้รูปลักษณ์ของพวกเขาสามารถรับชมสามมิติได้ อันที่จริงนิทรรศการยอดนิยมชิ้นหนึ่งที่งาน World’s Fair 2014 จะเป็นทีวี 3 มิติที่สร้างขึ้นขนาดเท่าตัวจริงซึ่งการแสดงบัลเล่ต์จะ มองเห็นได้ ลูกบาศก์จะค่อยๆ หมุนดูจากทุกมุม” ดูเหมือนไม่ตลก แต่ดูเหมือนไม่ถูกต้อง แน่นอน ประเด็นข้างเคียงในที่นี้คือเขาหมายถึงงาน World’s Fair 2014 ซึ่ง ไม่เกิดขึ้น

ความท้าทายทั่วไปในการประเมินบันทึกการติดตามการคาดการณ์คือเราไม่รู้ว่าจะเปรียบเทียบประวัติของใครบางคนกับอะไร การคาดการณ์ของคุณถูกต้องประมาณครึ่งหนึ่ง “ดี” หรือไม่น่าประทับใจไปกว่าการเขียนสิ่งต่างๆ ที่อาจเกิดขึ้นและพลิกเหรียญในแต่ละข้อหรือไม่

ฉันคิดว่าสิ่งนี้มาจาก ความยากของการคาดคะเน ซึ่งยากต่อการประเมินอย่างเป็นระบบ สิ่งที่ดีเกี่ยวกับการศึกษานี้คือ มีการคาดการณ์เพียงพอที่จะได้ขนาดตัวอย่างที่เหมาะสม แต่สิ่งทั้งหมดมีเพียงพอที่คุณจะได้สัมผัสเชิงคุณภาพที่ดีสำหรับการคาดคะเนด้วยตัวมันเอง (นี่คือเหตุผลที่ฉันยกตัวอย่าง คุณสามารถดูการคาดคะเนทั้งหมดสำหรับบุคคลหนึ่ง ๆ ได้โดยคลิกที่ชื่อของพวกเขาเหนือตาราง) ในกรณีนี้ ฉันคิดว่าอาซิมอฟมีแนวโน้มที่จะทำนายที่ไม่ชัดเจนและมีรายละเอียด ซึ่งฉันคิดว่าน่าประทับใจ ได้รับ ~ ครึ่งหนึ่งถูกต้อง

คลาร์ก

หมวดหมู่ # ถูกต้อง # ไม่ถูกต้อง #คลุมเครือ/ใกล้พลาด ถูกต้อง / (ถูก + ผิด)
คำทำนายทั้งหมด

129

148

48

46.57%

การคาดการณ์ทางเทคนิค

85

82

29

50.90%

การทำนายที่ยาก

14

10

4

58.33%

ยาก + เทคโนโลยี + วันที่แน่นอน

6

5

2

54.55%

ตัวอย่าง (ดังข้างบน): 7

  • แก้ไขคำทำนายปี พ.ศ. 2507 เกี่ยวกับปี พ.ศ. 2543 ได้ถูกต้อง: “[ดาวเทียมสื่อสาร] จะทำให้โลกนี้เป็นโลกที่เราสามารถติดต่อกันได้ทันทีไม่ว่าเราจะอยู่ที่ใด ที่ซึ่งเราสามารถติดต่อเพื่อนของเราได้ทุกที่บนโลก ถึงแม้ว่าเราจะไม่ทราบความจริงของพวกเขา ตำแหน่งทางกายภาพ ในยุคนั้น อาจจะเพียงห้าสิบปีต่อจากนี้สำหรับ [บุคคล] ที่จะทำธุรกิจ [ของพวกเขา] จากตาฮิติหรือบาหลีเช่นเดียวกับ [พวกเขา] จากลอนดอน” (ฉันคิดว่า “ดำเนินธุรกิจ [ของพวกเขา]” หมายถึงการติดต่อทางธุรกิจมากกว่าการเรียกร้องแบบองค์รวมบางประเภทว่าไม่มีการสูญเสียประสิทธิภาพการทำงานจากการทำงานระยะไกล)
  • ถูกต้องตามคำทำนายในปี พ.ศ. 2493 ประมาณปี พ.ศ. 2543: “แท้จริงแล้ว อาจสันนิษฐานได้ค่อนข้างแน่นอนว่าการลาดตระเวนครั้งแรกของดาวเคราะห์จะเป็นการโคจรรอบจรวดซึ่งไม่ได้พยายามจะลงจอด เครื่องจักรไร้คนขับที่ใช้แล้วทิ้งอาจใช้การวัดระยะทางและโทรทัศน์อย่างประณีต” ดูเหมือนจะไม่ใช่คำทำนายที่เฉียบขาด การคาดคะเนที่ถูกต้องจำนวนมากของเขามีรสนิยมทั่วไปที่จะบอกว่าความคืบหน้าจะไม่น่าตื่นเต้น เกินไป และฉันพบว่าสิ่งเหล่านี้น่าประทับใจน้อยกว่าการคาดการณ์ที่ถูกต้องของ Asimov ส่วนใหญ่
  • การคาดการณ์ที่ไม่ถูกต้องในปี พ.ศ. 2503 เมื่อปี พ.ศ. 2553 “ใครๆ ก็นึกภาพออกว่าก่อนสิ้นศตวรรษนี้ โรงงานขนาดใหญ่ขนาดใหญ่ที่ใช้พลังงานราคาถูกจากเครื่องปฏิกรณ์นิวเคลียร์แสนสาหัสเพื่อสกัดน้ำบริสุทธิ์ เกลือ แมกนีเซียม โบรมีน สตรอนเทียม รูบิเดียม ทองแดง และโลหะอื่นๆ อีกมาก จากทะเล ข้อยกเว้นที่โดดเด่นจากรายการคือ เหล็ก ซึ่งหาได้ยากในมหาสมุทรมากกว่าในทวีปต่างๆ “
  • การทำนายปี 1949 ที่ไม่ถูกต้องเกี่ยวกับปี 1983: “ก่อนที่เรื่องนี้จะโตเป็นสองเท่าของอายุปัจจุบัน เราจะมีนักสำรวจหุ่นยนต์กระจายอยู่ทั่วดาวอังคาร”

โดยทั่วไปแล้วฉันพบว่าชุดข้อมูลนี้น่าพึงพอใจ/เป็นการศึกษาน้อยกว่าของ Asimov: การคาดคะเนจำนวนมากนั้นค่อนข้างลึกซึ้งในวัชพืชว่าจรวดทำงานอย่างไรหรืออะไรทำนองนั้น และส่วนมากก็ค่อนข้างยากที่จะตีความ/ให้คะแนน ฉันคิดว่าการคาดคะเนที่แย่นั้นค่อนข้างแย่ และบางครั้งการคาดคะเนที่ดีนั้นก็ดี แต่โดยทั่วไปแล้วน่าประทับใจน้อยกว่าของอาซิมอฟ

ไฮน์ไลน์

หมวดหมู่ # ถูกต้อง # ไม่ถูกต้อง #คลุมเครือ/ใกล้พลาด ถูกต้อง / (ถูก + ผิด)
คำทำนายทั้งหมด

19

41

7

31.67%

การคาดการณ์ทางเทคนิค

14

20

6

41.18%

การทำนายที่ยาก

1

16

1

5.88%

ยาก + เทคโนโลยี + วันที่แน่นอน

0

1

1

0.00%

สิ่งนี้ดูแย่มาก โดยเฉพาะอย่างยิ่งเมื่อปรับตามความยาก: สิ่งที่ “ถูกต้อง” หลายๆ อย่างดูเหมือนจะตีความยากหรือชัดเจนมาก (เช่น ไม่ต้องเดินทางข้ามเวลา) ฉันรู้สึกประทับใจกับคำทำนายของเขาที่ว่า “เราอาจจะยังคงรักษาไข้หวัดธรรมดาอยู่” จนกระทั่งฉันเห็นคำทำนายในแหล่งที่แยกต่างหากว่า “มะเร็ง ไข้หวัด และฟันผุทั้งหมดจะถูกพิชิต” โดยรวมแล้ว ดูเหมือนว่าเขาได้ทำนายเรื่องแปลก ๆ มากมายเกี่ยวกับการเดินทางในอวกาศ และจากนั้นก็คาดเดาสิ่งที่ไม่น่าจะเป็นไปได้ (เช่น ไม่ต้องเดินทางข้ามเวลา)

เขามีสิ่งที่ดีบางอย่างเช่น: “ภายในปี 2000 AD เราจะรู้อย่างมากเกี่ยวกับการทำงานของสมอง … ในขณะที่ในปี 1900 เรารู้เพียงเล็กน้อยว่าผิด ฉันไม่ได้ทำนายว่าความลึกลับพื้นฐานของจิตวิทยา — การที่มวลที่จัดเรียงในรูปแบบที่ซับซ้อนบางอย่างจะรับรู้ได้อย่างไร — จะได้รับการแก้ไขภายในปี ค.ศ. 2000 ฉันหวังว่าจะเป็นอย่างนั้น แต่อย่าคาดหวังเลย” เขายังทำนายว่ามนุษย์จะไม่มีการสูญพันธุ์และไม่มีวันสิ้นสุดของสงคราม – ฉันเดาว่าคนจำนวนมากไม่เห็นด้วยกับสิ่งเหล่านี้ในขณะนั้น

ภาพรวม

ดูเหมือนว่าใน “บิ๊กทรี” เรามี:

  • หนึ่ง (อาซิมอฟ) ที่ดูค่อนข้างน่าประทับใจ – พลาดมากมาย แต่อัตราการโจมตี 50% จากการคาดคะเนที่ไม่ชัดเจนนั้นดูดีมาก
  • หนึ่ง (ไฮน์ไลน์) ที่ดูไม่จริงจังและไม่ถูกต้อง
  • คนหนึ่ง (คลาร์ก) ที่ตัดสินค่อนข้างยาก แต่โดยรวมแล้วดูค่อนข้างแข็งแกร่ง (ประมาณครึ่งหนึ่งของการคาดการณ์ของเขาดูเหมือนจะถูกต้อง

อนาคตของวันนี้กับการคาดการณ์เหล่านี้

ข้อมูลข้างต้นรวบรวมการคาดการณ์แบบไม่เป็นทางการ – ไม่มีการให้ความน่าจะเป็น การให้เหตุผลเพียงเล็กน้อยหรือไม่มีเลย ไม่มีความพยายามที่ชัดเจนในการรวบรวมหลักฐานและชั่งน้ำหนักข้อโต้แย้ง – โดยนักเขียนนิยายมืออาชีพ

เปรียบเทียบสถานการณ์นี้กับสรุป บรรทัดต่างๆ ของการคาดการณ์การให้เหตุผลเพื่อคาดการณ์ AI ที่ก่อให้เกิดการเปลี่ยนแปลง หลังรวมถึง:

มีพื้นที่มากมายสำหรับการอภิปรายว่าควรคาดหวังให้มาตรการเหล่านี้มากน้อยเพียงใดเพื่อปรับปรุงการมองการณ์ไกลของเรา เมื่อเทียบกับสิ่งที่ “บิ๊กทรี” ทำ ฉันเดาว่าเราควรจะ คาดการณ์เกี่ยวกับ AI ที่เปลี่ยนแปลง ได้อย่างจริงจังมากขึ้น ส่วนหนึ่งเป็นเพราะฉันคิดว่ามีความแตกต่างใหญ่ระหว่าง “ความพยายามเพียงเล็กน้อย” (โดยทั่วไปแล้วคาดเดานอกกรอบโดยไม่ต้องตรวจสอบข้อโต้แย้งและข้อโต้แย้งอย่างจริงจังซึ่งก็คือ ความประทับใจของฉันต่อสิ่งที่บิ๊กทรีส่วนใหญ่ทำ) และ “ใช้ความพยายามในระดับปานกลาง” (พิจารณาความคิดเห็นของผู้เชี่ยวชาญ การสำรวจข้อโต้แย้ง และข้อโต้แย้ง การคิดอย่างชัดเจนเกี่ยวกับระดับของความไม่แน่นอนของตนเอง)

แต่เวอร์ชัน “ใช้ความพยายามเพียงเล็กน้อย” ก็ไม่ได้ดูแย่ขนาดนั้น

หากคุณดูการคาดการณ์เกี่ยวกับ AI ที่เปลี่ยนแปลงและคิดว่า “บางทีนี่อาจเป็นการคาดคะเนของ Asimov-ish ที่มีอัตราการเข้าชมประมาณ 50% สำหรับคำถามที่ยาก บางทีนี่อาจเป็นการคาดคะเนของ Heinlein-ish ที่พื้นๆ ไร้สาระ” ซึ่งยังดูดีพอที่จะรับได้ สมมติฐาน ” ศตวรรษที่สำคัญที่สุด ” อย่างจริงจัง

ภาคผนวก: การศึกษาอื่น ๆ เกี่ยวกับประวัติของลัทธิอนาคตนิยม

โปรเจ็ก ต์ปี 2013 ประเมินการคาดการณ์ในปี 1999 ของ Ray Kurzweil เกี่ยวกับปี 2009 และการติดตามในปี 2020 ประเมิน การคาดการณ์ในปี 1999 ของเขาในปี 2019 Kurzweil ขึ้นชื่อว่ามีความ น่าสนใจในขณะนั้น มากกว่าที่จะ เข้าใจถึงปัญหาย้อนหลัง และมีการพบและให้คะแนนการคาดคะเนจำนวนมาก ดังนั้นฉันจึงถือว่าการศึกษานี้มีข้อได้เปรียบที่คล้ายคลึงกันกับการศึกษาข้างต้น

  • การคาดคะเนชุดแรก (ประมาณปี พ.ศ. 2552 ซึ่งเป็นช่วง 10 ปี) มีการคาดคะเนที่ “จริงหรือจริงเล็กน้อย” มากเท่ากับการคาดคะเน “เท็จหรือเท็จเพียงเล็กน้อย”
  • ครั้งที่สอง (ประมาณปี 2019 ซึ่งเป็นช่วง 20 ปี) เลวร้ายกว่ามาก โดย 52% ของการคาดการณ์เป็น “เท็จ” และ “เท็จหรือเท็จเล็กน้อย” อย่างตรงไปตรงมา ซึ่งมากกว่าการคาดการณ์ที่ “จริงหรือจริงเพียงเล็กน้อย” เกือบ 3 ต่อ 1

Kurzweil ขึ้นชื่อในเรื่องการคาดการณ์ที่กล้าหาญและขัดแย้งของเขา และโดยรวมแล้วฉันมีแนวโน้มที่จะเรียกประวัติของเขาว่า “ปานกลาง” และ “ดี” – โดยรวมแล้วก้าวร้าวเกินไป แต่มีเพลงฮิตที่โดดเด่นอยู่บ้าง (ฉันคิดว่าถ้าสมมติฐาน ที่สำคัญที่สุดของศตวรรษ กลายเป็นจริง เขาจะดูมีความเข้าใจในวงกว้างมาก แค่ช่วงแรกๆ หากไม่เป็นเช่นนั้น เขาจะดูไร้เหตุผลในวงกว้าง แต่นั่นคือ TBD)

กระดาษปี 2002 ซึ่งสรุปโดย Luke Muehlhauser ที่นี่ ได้ประเมินประวัติของ ปี 2000 โดย Herman Kahn และ Anthony Wiener “หนึ่งในผลิตภัณฑ์ที่มีชื่อเสียงและเป็นที่เคารพนับถือที่สุดของนักอนาคตนิยมมืออาชีพ”

  • ประมาณ 45% ของการคาดการณ์ได้รับการตัดสินว่าแม่นยำ
  • ลุคสรุปว่าคาห์นและวีเนอร์มั่นใจมากเกินไป เพราะเขาตีความว่าพวกเขาเป็นการทำนายด้วยความมั่นใจ 90-95%
  • Takeaway ของฉันแตกต่างกันเล็กน้อย ฉันเห็นหัวข้อที่เกิดซ้ำซึ่งผู้คนมักจะได้รับอัตราการเข้าชม 40-50% จากการคาดการณ์ที่น่าสนใจเกี่ยวกับอนาคต แต่บางครั้งนำเสนอการคาดคะเนเหล่านี้ด้วยความมั่นใจอย่างยิ่ง (ซึ่งทำให้ดูโง่)
  • ฉันคิดว่าเราสามารถแยก “ผู้พยากรณ์ในอดีตมั่นใจมากเกินไป” (ซึ่งฉันสงสัยว่าส่วนหนึ่งเป็นเพราะการ แสดงออกที่ชัดเจนและการหาปริมาณของความไม่แน่นอน เป็นเรื่องผิดปกติและ/หรือท้อแท้ในบริบทที่เกี่ยวข้อง) จาก “ผู้พยากรณ์ในอดีตไม่สามารถคาดการณ์ที่น่าสนใจที่มีเหตุผลได้ มีแนวโน้มที่จะถูกต้อง” อดีตดูเหมือนจริงสำหรับฉัน แต่อย่างหลังไม่

แบบสำรวจของลุคในปี 2019 เกี่ยวกับประวัติลัทธิอนาคตนิยม ระบุเอกสารที่เกี่ยวข้องอีกสองฉบับ ( ที่นี่ และ ที่นี่ ); ฉันไม่ได้อ่านสิ่งเหล่านี้นอกเหนือจากบทคัดย่อ แต่อัตราความแม่นยำโดยรวมคือ 76% และ 37% ตามลำดับ เป็นการยากที่จะตีความตัวเลขเหล่านั้นโดยไม่ได้รู้สึกว่าการทำนายนั้นท้าทายเพียงใด

โพสต์ในฟอรัม EA ปี 2021 ดูที่บันทึกการติดตามรวมของผู้พยากรณ์ใน PredictionBook และ Metaculus รวมถึงการวิเคราะห์เฉพาะของการคาดการณ์ 5 ปีขึ้นไป แม้ว่าฉันจะไม่พบว่าง่ายที่จะสรุปว่าประสิทธิภาพนั้น “ดี” หรือ “แย่” ” (หรือคำถามที่คล้ายกับคำถามที่ฉันสนใจ)

บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี บันทึกการติดตามของนักอนาคตดูเหมือน ... สบายดี

แสดงความคิดเห็น/อภิปราย


เชิงอรรถ

  1. การเปิดเผยข้อมูล: ฉันเป็นซีอีโอร่วมของ Open Philanthropy

  2. ฉันยัง Googled สั้น ๆ สำหรับการคาดคะเนของพวกเขาเพื่อให้ได้รับความรู้สึกเบื้องต้นว่าพวกเขาเป็นประเภทของการคาดการณ์ที่เกี่ยวข้องหรือไม่ ฉันพบบทความสองสามบทความที่แสดงตัวอย่างการคาดคะเนที่ดีและไม่ดี แต่ไม่มีสิ่งใดที่เป็นระบบ ฉันอ้างว่าฉันไม่ได้ออกกำลังกายแบบนี้กับคนอื่นและโยนมันทิ้งไป
  3. นั่นคือถ้าเราไม่มีมีมอยู่เบื้องหลังว่ายากแค่ไหนที่จะทำนายอนาคต
  4. 1 – เป็นที่รู้จักโดยทั่วไปแล้ว

    2 – เป็นฉันทามติของผู้เชี่ยวชาญ

    3 – เก็งกำไร แต่มีแนวโน้ม

    4 – เหนือเทรนด์ หรือมีรายละเอียดที่แปลกประหลาด

    5 – เฉียบขาด ไม่ตกเทรนด์

  5. การคาดการณ์ในชุดข้อมูลน้อยมากนั้นมีอายุน้อยกว่า 30 ปี และฉันก็แค่เพิกเฉย

  6. อาซิมอฟมีเพียงหนึ่งการทำนายที่ไม่ถูกต้องในหมวดหมู่นี้ ดังนั้นสำหรับคำทำนายที่ไม่ถูกต้องครั้งที่ 2 ฉันจึงใช้คำที่มีปัญหา “3” แทน “4”
  7. คำทำนายแรกในรายการนี้เข้าเกณฑ์เกณฑ์ที่เคร่งครัดที่สุดเมื่อผมร่างบทความนี้ขึ้นเป็นครั้งแรก แต่ตอนนี้ถูกปรับเป็นระดับความยาก=3/5 ซึ่งผมไม่เห็นด้วย (ผมคิดว่าเป็นการคาดคะเนที่ประทับใจมาก มากกว่าที่เหลือ ที่มีคุณสมบัติตามความยาก=4/5)
  8. ดู รายงานนี้ เกี่ยวกับการสอบเทียบสำหรับผู้ตรวจสอบทุน Open Philanthropy (แม้ว่าจะเป็นกลุ่มคนที่แตกต่างจากผู้ที่ค้นคว้าเกี่ยวกับไทม์ไลน์ AI ที่เปลี่ยนแปลง)