<?xml version="1.0" encoding="UTF-8"?>        <rss version="2.0"
             xmlns:atom="http://www.w3.org/2005/Atom"
             xmlns:dc="http://purl.org/dc/elements/1.1/"
             xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
             xmlns:admin="http://webns.net/mvcb/"
             xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
             xmlns:content="http://purl.org/rss/1.0/modules/content/">
        <channel>
            <title>
									ว่าด้วยเรื่อง GPT3 และ OpenAI API (Update กรกฏาคม 2021 ) - คุยกันภาษา AI				            </title>
            <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/</link>
            <description>ThAI Keras Discussion Board</description>
            <language>en-US</language>
            <lastBuildDate>Tue, 12 May 2026 22:07:28 +0000</lastBuildDate>
            <generator>wpForo</generator>
            <ttl>60</ttl>
							                    <item>
                        <title>RE: ว่าด้วยเรื่อง GPT3 และ OpenAI API (Update กรกฏาคม 2021 )</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/3/#post-730</link>
                        <pubDate>Tue, 21 Sep 2021 02:14:22 +0000</pubDate>
                        <description><![CDATA[AI &amp; Language Models กับ common sense สัมภาษณ์ Yejin Choi 202สัมภาษณ์ D. Lenat @ cy]]></description>
                        <content:encoded><![CDATA[<p>AI &amp; Language Models กับ common sense</p><p> </p><p>สัมภาษณ์ Yejin Choi 2021</p><p>https://twimlai.com/social-commonsense-reasoning-with-yejin-choi/</p><p> </p><p>สัมภาษณ์ D. Lenat @ cyc</p><p>https://youtu.be/3wMKoSRbGVs</p>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/3/#post-730</guid>
                    </item>
				                    <item>
                        <title>RE: ว่าด้วยเรื่อง GPT3 และ OpenAI API (Update กรกฏาคม 2021 )</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-720</link>
                        <pubDate>Tue, 17 Aug 2021 13:22:08 +0000</pubDate>
                        <description><![CDATA[AI21 startup จากอิสราเอลเปิดให้ทุกคนทดลองใช้โมเดล NLP Transformers ที่ใหญ่เทียบเท่า GPT-3 (178B) ได้โดยไม่ต้องรอ waiting list ที่นี่ครับโดยโมเดลนี้เรียกว่า Jurassic Jumbo และสามารถใช้ quota ...]]></description>
                        <content:encoded><![CDATA[<div class="" data-block="true" data-editor="fc8l" data-offset-key="4mhu3-0-0"><div class="_1mf _1mj" data-offset-key="4mhu3-0-0"><span data-offset-key="4mhu3-0-0">AI21 startup จากอิสราเอลเปิดให้ทุกคนทดลองใช้โมเดล NLP Transformers ที่ใหญ่เทียบเท่า GPT-3 (178B) ได้โดยไม่ต้องรอ waiting list ที่นี่ครับ</span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="9o4hs-0-0"><div class="_1mf _1mj" data-offset-key="9o4hs-0-0"><span data-offset-key="9o4hs-0-0"> </span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="dpejb-0-0"><div class="_1mf _1mj" data-offset-key="dpejb-0-0"><span class="py34i1dx"><span data-offset-key="dpejb-0-0">https://studio.ai21.com/playground</span></span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="8phf5-0-0"><div class="_1mf _1mj" data-offset-key="8phf5-0-0"><span data-offset-key="8phf5-0-0"> </span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="b0gva-0-0"><div class="_1mf _1mj" data-offset-key="b0gva-0-0"><span data-offset-key="b0gva-0-0">โดยโมเดลนี้เรียกว่า Jurassic Jumbo และสามารถใช้ quota ได้วันละ 10,000 tokens (รวมอ่าน prompt + เขียนต่อ) โดยใช้งานครั้งนึงไม่เกิน 2,048 tokens ครับ</span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="d28lf-0-0"><div class="_1mf _1mj" data-offset-key="d28lf-0-0"><span data-offset-key="d28lf-0-0"> </span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="86ksi-0-0"><div class="_1mf _1mj" data-offset-key="86ksi-0-0"><span data-offset-key="86ksi-0-0">Jurassic มีความแตกต่างจาก GPT-3 เล็กน้อยก็คือ เทรนบน token vocab ราว 250,000 ซึ่งมากกว่า GPT-3 ที่มี token vocab ขนาด 50,000 ซึ่งทำให้ ข้อความเต็มลิมิตที่ 2048 tokens นั้นมีความยาวกว่า GPT-3 ต้นฉบับ (อ่าน+เขียนได้ยาวกว่านั่นเอง)</span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="1i5ev-0-0"><div class="_1mf _1mj" data-offset-key="1i5ev-0-0"><span data-offset-key="1i5ev-0-0"> </span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="3tbvi-0-0"><div class="_1mf _1mj" data-offset-key="3tbvi-0-0"><span data-offset-key="3tbvi-0-0">เท่าที่ลองดูความสามารถด้อยกว่า GPT-3 เพียงเล็กน้อย ถือว่าใกล้เคียงเลยครับ</span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="29j47-0-0"><div class="_1mf _1mj" data-offset-key="29j47-0-0"><span data-offset-key="29j47-0-0"> </span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="3edko-0-0"><div class="_1mf _1mj" data-offset-key="3edko-0-0"><span data-offset-key="3edko-0-0">นอกจากนี้ยังสามารถใช้งานผ่าน API และให้ user finetune model เพื่อปรับให้เข้ากับงานเฉพาะทางได้โดยไม่มีค่าใช้จ่าย (แต่จะไปมีค่าใช้จ่ายตอนใช้งาน)</span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="84eeb-0-0"><div class="_1mf _1mj" data-offset-key="84eeb-0-0"><span data-offset-key="84eeb-0-0"> </span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="dssq0-0-0"><div class="_1mf _1mj" data-offset-key="dssq0-0-0"><span data-offset-key="dssq0-0-0">ดูเพิ่มเติม AI21 Blog</span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="867d5-0-0"><div class="_1mf _1mj" data-offset-key="867d5-0-0"><span class="py34i1dx"><span data-offset-key="867d5-0-0">https://www.ai21.com/blog/announcing-ai21-studio-and-jurassic-1</span></span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="13v3o-0-0"><div class="_1mf _1mj" data-offset-key="13v3o-0-0"><span data-offset-key="13v3o-0-0"> </span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="54p6t-0-0"><div class="_1mf _1mj" data-offset-key="54p6t-0-0"><span data-offset-key="54p6t-0-0">บทความเก่าเกี่ยวกับ GPT-3 (โหลดช้าหน่อยนะครับ)</span></div></div><div class="" data-block="true" data-editor="fc8l" data-offset-key="4jo76-0-0"><div class="_1mf _1mj" data-offset-key="4jo76-0-0"><span class="py34i1dx"><span data-offset-key="4jo76-0-0">http://bit.ly/thaikeras-openai-gpt</span></span></div></div>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-720</guid>
                    </item>
				                    <item>
                        <title>RE: ว่าด้วยเรื่อง GPT3 และ OpenAI API (Update กรกฏาคม 2021 )</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-709</link>
                        <pubDate>Wed, 21 Jul 2021 03:19:23 +0000</pubDate>
                        <description><![CDATA[Building AGI Using Language Model]]></description>
                        <content:encoded><![CDATA[<h1 class="article-title">Building AGI Using Language Models</h1><p>https://bmk.sh/2020/08/17/Building-AGI-Using-Language-Models/</p>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-709</guid>
                    </item>
				                    <item>
                        <title>RE: ว่าด้วยเรื่อง GPT3 และ OpenAI API (Update กรกฏาคม 2021 )</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-693</link>
                        <pubDate>Tue, 06 Jul 2021 03:43:07 +0000</pubDate>
                        <description><![CDATA[จาก GPT-3 สู่ AGI -- ความท้าทาย 7 เรื่องThaiKeras &amp; Kaggle - 13 June 2021 ถึงวันนี้ก็เกิน 1 ปีแล้วที่ OpenAI ได้เผยแพร่ GPT-3 ซึ่งยังเป็น Language Model หรือโมเดลที่มี &quot;ความรู้&quot; และสามาร...]]></description>
                        <content:encoded><![CDATA[<div class="" data-block="true" data-editor="8sgpi" data-offset-key="6c26l-0-0"><div class="_1mf _1mj" data-offset-key="6c26l-0-0"><span style="text-decoration: underline;font-size: 18pt"><strong>จาก GPT-3 สู่ AGI -- ความท้าทาย 7 เรื่อง</strong></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="71en7-0-0"><div class="_1mf _1mj" data-offset-key="71en7-0-0"><span data-offset-key="71en7-0-0">ThaiKeras &amp; Kaggle - 13 June 2021</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="cd66k-0-0"><div class="_1mf _1mj" data-offset-key="cd66k-0-0"><span data-offset-key="cd66k-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="8f5h0-0-0"><div class="_1mf _1mj" data-offset-key="8f5h0-0-0"><span data-offset-key="8f5h0-0-0">ถึงวันนี้ก็เกิน 1 ปีแล้วที่ OpenAI ได้เผยแพร่ GPT-3 ซึ่งยังเป็น Language Model หรือโมเดลที่มี "ความรู้" และสามารถเขียนเรื่องราวได้ใกล้เคียงมนุษย์ทั่วไป และเป็นโมเดลที่เก่งที่สุดในหลายๆ แง่มุม </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="44i58-0-0"><div class="_1mf _1mj" data-offset-key="44i58-0-0"><span data-offset-key="44i58-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="3n7dd-0-0"><div class="_1mf _1mj" data-offset-key="3n7dd-0-0"><span data-offset-key="3n7dd-0-0">ล่าสุด Google ภูมิใจมากกับ ChatBot ตัวใหม่ชื่อว่า LaMBDA ที่คุยกับมนุษย์ โดยจินตนาการตัวเองเป็นดาวพลูโต หรือแม้แต่เครื่องบินกระดาษได้อย่างแนบเนียน (ดูวิดิโอบทสนทนาได้ที่อ้างอิง 1.) แต่เมื่อดู Chat ที่ Google โชว์แล้ว ความสามารถก็ถือว่าอยู่ในเลเวลพอๆ กับ GPT-3 ที่ออกมาก่อนราว 1 ปี ดังนั้นผมคิดว่าทีม OpenAI ยังนำทีมอื่นๆ อยู่ 1-2 ก้าวในเรื่องของการพัฒนาโมเดลที่จะมีความสามารถ หรือ "ฉลาด" แบบสมองมนุษย์อย่างแท้จริง</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="2cstg-0-0"><div class="_1mf _1mj" data-offset-key="2cstg-0-0"><span data-offset-key="2cstg-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1f64-0-0"><div class="_1mf _1mj" data-offset-key="1f64-0-0"><span data-offset-key="1f64-0-0"></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="cjcqp-0-0"><div class="_1mf _1mj" data-offset-key="cjcqp-0-0"><span data-offset-key="cjcqp-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1g25f-0-0"><div class="_1mf _1mj" data-offset-key="1g25f-0-0"><span data-offset-key="1g25f-0-0">โดยนับแต่ ThaiKeras สามารถเข้าทดลอง GPT-3 ได้เป็นเวลาเกือบ 3 เดือน เราได้ทดสอบความรู้ของ GPT-3 ในเรื่อง การแต่งนิยายสร้างสรรค์แบบดัดแปลงเนื้อเรื่อง / ChatBot ดาวพลูโต (แบบเดียวกับ Google) / การวิเคราะห์มูลค่ากิจการเชิงพื้นฐานด้วย 5-force analysis / วิเคราะห์ยุทธศาสตร์การเมืองระหว่างประเทศแบบ Geopolitics / วิเคราะห์จุดตายทางธุรกิจ (Failure Analysis) / แต่งคดีนักสืบสนุกๆ ให้เด็ก 5 ขวบ / ChatBot พนักงานขายสินค้าที่ขายสินค้าได้ทุกชนิด / จินตนาการเรื่องที่ไม่เคยเกิดขึ้นทางประวัติศาสตร์ (What-if Alternate History) / สรุปเหรียญ Crypto ที่มีชื่อเสียงสั้นๆ ให้เข้าใจง่าย / วิเคราะห์เหตุการณ์แบบ Abduction และ CounterFactual / คุยเรื่องนโยบายการเงินในระบบเศรษฐกิจ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="fhl0a-0-0"><div class="_1mf _1mj" data-offset-key="fhl0a-0-0"><span data-offset-key="fhl0a-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="8erpu-0-0"><div class="_1mf _1mj" data-offset-key="8erpu-0-0"><span data-offset-key="8erpu-0-0">จากการทดลองเบื้องต้นเหล่านี้ GPT-3 นั้นคุยและบรรยายทุกเรื่องได้อย่างน่าประทับใจ ถึงแม้ว่าจะไม่ถึงขั้นระดับผู้เชี่ยวชาญในวงการ เพราะยังมีจุดผิด หรือจุดที่ไม่ลึกซึ้งอยู่ แต่ก็ไม่ต่างจากการสนทนากับเพื่อนของเราเองบนโต้ะอาหาร ที่เราก็คุยกันได้สนุก ถกได้หลายประเด็น ได้ลึกระดับนึง แม้จะถูกๆ ผิดๆ ในบางเรื่องก็ตาม</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="d4q4b-0-0"><div class="_1mf _1mj" data-offset-key="d4q4b-0-0"><span data-offset-key="d4q4b-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ai3vd-0-0"><div class="_1mf _1mj" data-offset-key="ai3vd-0-0"><span data-offset-key="ai3vd-0-0">ดังนั้นคำถามที่น่าสนใจก็คือ ยังมีอะไรที่ GPT-3 ทำไม่ได้บ้าง หรือ ในการจะเดินก้าวถัดไปสู่การเป็น "ปัญญาประดิษฐ์ของจริง" ที่คุยและเข้าใจได้ทุกเรื่องอย่างลึกซึ่้งเหมือนที่เราเห็น Jarvis ใน IronMan หรือนิยายวิทยาศาสตร์อื่นๆ </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="466q-0-0"><div class="_1mf _1mj" data-offset-key="466q-0-0"><span data-offset-key="466q-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="fclra-0-0"><div class="_1mf _1mj" data-offset-key="fclra-0-0"><span data-offset-key="fclra-0-0">ซึ่งก็คือ ปัญญาประดิษฐ์ในระดับที่เราเรียกกันว่า AGI (Artificial General Intelligence) นั่นเอง</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ctopq-0-0"><div class="_1mf _1mj" data-offset-key="ctopq-0-0"><span data-offset-key="ctopq-0-0"></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ka5q-0-0"><div class="_1mf _1mj" data-offset-key="ka5q-0-0"><span data-offset-key="ka5q-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="cgole-0-0"><div class="_1mf _1mj" data-offset-key="cgole-0-0"><span data-offset-key="cgole-0-0">.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ajj80-0-0"><div class="_1mf _1mj" data-offset-key="ajj80-0-0"><span data-offset-key="ajj80-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="e0b8b-0-0"><div class="_1mf _1mj" data-offset-key="e0b8b-0-0"><span style="text-decoration: underline"><strong>GPT-3 ยังต้องพัฒนาจุดไหนบ้าง</strong></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ab2b3-0-0"><div class="_1mf _1mj" data-offset-key="ab2b3-0-0"><span data-offset-key="ab2b3-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="avcuj-0-0"><div class="_1mf _1mj" data-offset-key="avcuj-0-0"><span data-offset-key="avcuj-0-0">ในบทความนี้เราได้เซอเวย์งานวิจัยในด้านวิทยาการปัญญาประดิษฐ์ และสรุปได้ว่ามีอย่างน้อย 7 เรื่อง ที่ GPT-3 ยังไม่สามารถทำได้อย่างสมบูรณ์แบบครับ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="8ncgv-0-0"><div class="_1mf _1mj" data-offset-key="8ncgv-0-0"><span data-offset-key="8ncgv-0-0"> A. Commonsense และ Mental Model</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="cfahh-0-0"><div class="_1mf _1mj" data-offset-key="cfahh-0-0"><span data-offset-key="cfahh-0-0"> B. System 2 Integration</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="8d23l-0-0"><div class="_1mf _1mj" data-offset-key="8d23l-0-0"><span data-offset-key="8d23l-0-0"> C. Continual หรือ Life-long Learning</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="4jnc0-0-0"><div class="_1mf _1mj" data-offset-key="4jnc0-0-0"><span data-offset-key="4jnc0-0-0">D. &amp; E. Vision &amp; Reinforcement Integration</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="976rk-0-0"><div class="_1mf _1mj" data-offset-key="976rk-0-0"><span data-offset-key="976rk-0-0"> F. Long-range Reasoning / Long-term goal planning</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="88i4u-0-0"><div class="_1mf _1mj" data-offset-key="88i4u-0-0"><span data-offset-key="88i4u-0-0"> G. Precise &amp; Creative Thinking eg. Nudge Design / Detective Case Story Generating</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="f4db7-0-0"><div class="_1mf _1mj" data-offset-key="f4db7-0-0"><span data-offset-key="f4db7-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="egm4l-0-0"><div class="_1mf _1mj" data-offset-key="egm4l-0-0"><span data-offset-key="egm4l-0-0">.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="arl43-0-0"><div class="_1mf _1mj" data-offset-key="arl43-0-0"><span data-offset-key="arl43-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="8lp6r-0-0"><div class="_1mf _1mj" data-offset-key="8lp6r-0-0"><span style="text-decoration: underline"><strong>1. CommonSense และ Mental Model</strong></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="b96eh-0-0"><div class="_1mf _1mj" data-offset-key="b96eh-0-0"> </div></div><div data-offset-key="b96eh-0-0">https://i.ibb.co/r7M5fYp/gpt3-common-1-mental-model.jpg</div><div data-offset-key="b96eh-0-0"> </div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="208vg-0-0"><div class="_1mf _1mj" data-offset-key="208vg-0-0"><span data-offset-key="208vg-0-0">Commonsense Knowledge (ความรู้จากสามัญสำนึก) คือ </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1e4rp-0-0"><div class="_1mf _1mj" data-offset-key="1e4rp-0-0"><span data-offset-key="1e4rp-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="dfcf3-0-0"><div class="_1mf _1mj" data-offset-key="dfcf3-0-0"><span data-offset-key="dfcf3-0-0">"ความรู้ง่ายๆ แบบที่คนส่วนใหญ่คิดว่า ใครๆ ก็รู้ (too obvious) เลยไม่จำเป็นต้องพูดหรือเขียนบอกกัน" </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="657qd-0-0"><div class="_1mf _1mj" data-offset-key="657qd-0-0"><span data-offset-key="657qd-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="70n8p-0-0"><div class="_1mf _1mj" data-offset-key="70n8p-0-0"><span data-offset-key="70n8p-0-0">เช่น ถ้าน้ำหยดใส่ของแข็งแล้วเราเอามือไปจับ ส่วนใหญ่มือเราก็จะเปียก หรือ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="18pq8-0-0"><div class="_1mf _1mj" data-offset-key="18pq8-0-0"><span data-offset-key="18pq8-0-0">ถ้ามีผลไม้เน่าวางอยู่ แล้วเราเอาช้อนไปตัก ช้อนก็มักจะมีกลิ่นไม่พึงประสงค์ เป็นต้น</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="c9hul-0-0"><div class="_1mf _1mj" data-offset-key="c9hul-0-0"><span data-offset-key="c9hul-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1qjh7-0-0"><div class="_1mf _1mj" data-offset-key="1qjh7-0-0"><span data-offset-key="1qjh7-0-0">ความรู้ง่ายๆ เหล่านี้เรามักเข้าใจกันว่าทุกคนก็ "รู้กันอยู่แล้ว" เวลาส่งความรู้ผ่านตัวหนังสือ จึงไม่มีความจำเป็นต้องมีการเขียนบรรยายแบบละเอียด เพราะคนที่อ่านทุกคนก็สามารถ "จินตนาการ" เรื่องที่ "ไม่ได้เขียน" กันต่อเองได้</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="av33o-0-0"><div class="_1mf _1mj" data-offset-key="av33o-0-0"><span data-offset-key="av33o-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ab7ti-0-0"><div class="_1mf _1mj" data-offset-key="ab7ti-0-0"><span data-offset-key="ab7ti-0-0">ที่มนุษย์เข้าใจเรื่องพวกนี้ได้ง่ายๆ เพราะมีกลไก การเรียนรู้ผ่านสายตา และผ่านกลไกอนุมาน (การเห็นเพียงไม่กี่ตัวอย่างก็ จินตนาการให้ครอบคลุมเหตุการณ์อื่นๆ ที่คล้ายกันได้) โดยกลไกเหล่านี้เข้าใจว่าผ่านกระบวนการวิวัฒนาการมานับล้านปี บนสายพันธุ์ Homo Sapiens ของเรา</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="epqaj-0-0"><div class="_1mf _1mj" data-offset-key="epqaj-0-0"><span data-offset-key="epqaj-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="bhk0v-0-0"><div class="_1mf _1mj" data-offset-key="bhk0v-0-0"><span data-offset-key="bhk0v-0-0">เรื่องเหล่านี้กลายมาเป็นจุดตายของ AI เพราะ "ความรู้" ของ AI อย่าง Language Models ทั่วไปนั้นได้มาจาก การอ่านจากตัวหนังสือเท่านั้น ดังนั้นสิ่งที่ไม่ได้เขียนเป็นตัวหนังสือ ก็ยากมากที่โมเดลเหล่านี้จะรู้ได้ (บางส่วนเจาะลึกไปแล้วในบทความ </span><span class="py34i1dx"><span data-offset-key="bhk0v-1-0">https://bit.ly/thaikeras-understanding-nlp</span></span><span data-offset-key="bhk0v-2-0"> ครับ)</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="78bd4-0-0"><div class="_1mf _1mj" data-offset-key="78bd4-0-0"><span data-offset-key="78bd4-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1dbg1-0-0"><div class="_1mf _1mj" data-offset-key="1dbg1-0-0"><span data-offset-key="1dbg1-0-0">เพื่อให้เข้าใจ ขอให้ลองอ่าน 2 ประโยคต่อไปนี้</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="2gml6-0-0"><div class="_1mf _1mj" data-offset-key="2gml6-0-0"><span data-offset-key="2gml6-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="7olim-0-0"><div class="_1mf _1mj" data-offset-key="7olim-0-0"><span data-offset-key="7olim-0-0">"เจมส์กับโจนส์กำลังจะวิ่งเข้าสู่เส้นชัย ทว่าโจนส์กลับล้มลงไปทำให้เจมส์นั้นต้องหันหลังกลับไปช่วย"</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="73mce-0-0"><div class="_1mf _1mj" data-offset-key="73mce-0-0"><span data-offset-key="73mce-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ckig-0-0"><div class="_1mf _1mj" data-offset-key="ckig-0-0"><span data-offset-key="ckig-0-0">สองประโยคนี้เหมือนจะไม่มีอะไร แต่ถ้าถามว่า </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="98gij-0-0"><div class="_1mf _1mj" data-offset-key="98gij-0-0"><span data-offset-key="98gij-0-0"> - สองคนนี้กำลังทำอะไรกันอยู่</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="5rg07-0-0"><div class="_1mf _1mj" data-offset-key="5rg07-0-0"><span data-offset-key="5rg07-0-0"> - สองคนนี้น่าจะอยู่ที่ไหน</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="a53p8-0-0"><div class="_1mf _1mj" data-offset-key="a53p8-0-0"><span data-offset-key="a53p8-0-0"> - ในประโยคแรกแรงจูงใจของสองคนนี้คืออะไร</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="5ka2h-0-0"><div class="_1mf _1mj" data-offset-key="5ka2h-0-0"><span data-offset-key="5ka2h-0-0"> - ในประโยคหลัง แรงจูงใจของเจมส์คืออะไร</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="d2ot0-0-0"><div class="_1mf _1mj" data-offset-key="d2ot0-0-0"><span data-offset-key="d2ot0-0-0"> - เวลาในเรื่องนี้น่าจะเป็นช่วงเวลากลางวัน หรือกลางคืน</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="d3e06-0-0"><div class="_1mf _1mj" data-offset-key="d3e06-0-0"><span data-offset-key="d3e06-0-0"> - ในประโยคแรกและสอง น่าจะห่างกันเป็นเวลาเท่าไร</span></div></div><div data-offset-key="1beeu-0-0"> </div><div data-offset-key="1beeu-0-0"><img src="https://i.ibb.co/9s5N110/gpt3-common-0-Kids-Race.jpg" /></div><div data-offset-key="1beeu-0-0"> </div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="6rqnd-0-0"><div class="_1mf _1mj" data-offset-key="6rqnd-0-0"><span data-offset-key="6rqnd-0-0">เชื่อว่าทุกคนที่อ่านสามารถเดาคำตอบทั้งหมดได้คล้ายๆ กัน แต่ลองคิดดูว่าโมเดล AI จะสามารถตอบคำถามทั้ง 6 ข้อด้านบนได้อย่างไร ในเมื่อมันไม่มี information ใดๆ บอกเลย</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="dmm9f-0-0"><div class="_1mf _1mj" data-offset-key="dmm9f-0-0"><span data-offset-key="dmm9f-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="4doql-0-0"><div class="_1mf _1mj" data-offset-key="4doql-0-0"><span data-offset-key="4doql-0-0">สำหรับ GPT-3 ซึ่งเป็นโมเดลที่อ่านตัวหนังสือมากที่สุด ได้อ่านมากกว่าโมเดลอื่นๆ รวมทั้งมีความจุของการเรียนรู้ (parameters) มากกว่าโมเดลอื่นๆ จึงทำให้เข้าใจเรื่อง commonsense นี้ มากกว่าโมเดลทั่วไป และสามารถตอบคำถามข้างบนได้บางส่วน!! (ซึ่งถือว่าเก่งมากๆ แล้ว)</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="fv7f8-0-0"><div class="_1mf _1mj" data-offset-key="fv7f8-0-0"><span data-offset-key="fv7f8-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="749r5-0-0"><div class="_1mf _1mj" data-offset-key="749r5-0-0"><span data-offset-key="749r5-0-0">เพื่อเป็นการเจาะประเด็นด้านนี้ ทีมวิจัยชื่อดังอย่าง Al2 ที่วิจัยเรื่องนี้อย่างจริงจังได้ทำการทดลองอย่างเข้มข้นและพบว่า GPT-3 นั้นตอบคำถามเรื่อง commonsense ได้ถูกต้องราว 73% ซึ่งน่าประทับใจเพราะพัฒนามาจาก GPT-2 ซึ่งมีตอบคำถามได้ถูกต้องเพียง 37% เท่านั้น (แต่อย่าลืมว่า GPT-3 ใหญ่กว่า GPT-2 หนึ่งร้อยเท่า)</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="3214r-0-0"><div class="_1mf _1mj" data-offset-key="3214r-0-0"><span data-offset-key="3214r-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="6rs84-0-0"><div class="_1mf _1mj" data-offset-key="6rs84-0-0"><span data-offset-key="6rs84-0-0">ยังมีช่องว่างจากมนุษย์ที่เข้าใจเรื่องง่ายๆ เหล่านี้ได้แทบจะ 100% อยู่มากทั้งที่ GPT-3 แทบจะอ่านตัวหนังสือทั้งหมดบนโลกแล้วก็ตาม</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="fduub-0-0"><div class="_1mf _1mj" data-offset-key="fduub-0-0"><span data-offset-key="fduub-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="c2pvm-0-0"><div class="_1mf _1mj" data-offset-key="c2pvm-0-0"><span data-offset-key="c2pvm-0-0">งานวิจัยของทีม AI2 ดูเพิ่ม ได้ที่อ้างอิง 2. ในงานวิจัยที่ชื่อ Atomic + Comet 2020</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="8gt4h-0-0"><div class="_1mf _1mj" data-offset-key="8gt4h-0-0"><span data-offset-key="8gt4h-0-0">นอกจากนี้ยังมีงานวิจัยของทีม Elemental Cognition เกี่ยวกับการวิเคราะห์ commonsense ที่อ้างอิง 3.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="4kdqa-0-0"><div class="_1mf _1mj" data-offset-key="4kdqa-0-0"><span data-offset-key="4kdqa-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1r8vv-0-0"><div class="_1mf _1mj" data-offset-key="1r8vv-0-0"><span data-offset-key="1r8vv-0-0">นอกจากเรื่อง Commonsense แล้ว นักจิตวิทยา และนักวิทยาศาสตร์การรู้คิด (Cognitive Scientist) ที่ทำความเข้าใจเกี่ยวกับกระบวนการคิดในสมองมนุษย์มานาน ยังเชื่อว่า เวลามนุษย์ทำความเข้าใจเหตุการณ์ต่างๆ ไม่ว่าจะเป็นการมองเห็นเพียงรูปเดียว หรือการอ่านหนังสือเพียง 2 ประโยคนั้น มนุษย์ได้สร้าง "โมเดลจำลอง" (Mental Model - รูปที่ 1) เกี่ยวกับเหตุการณ์นั้นๆ ขึ้นมาในหัว โดย Mental Model นี้นอกจาก common sense แล้วยังมี เรื่องของ ความเชื่อ คุณค่า สมมติฐาน ภาษา และอื่นๆ อีกมากมายตามรูปที่ 1 ซึ่งทำให้มนุษย์แต่ละคนมีความสามารถอธิบายปรากฏการณ์ต่างๆ ได้ เพียงแต่อาจจะไม่ตรงกันในบางเรื่อง</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="4kbtg-0-0"><div class="_1mf _1mj" data-offset-key="4kbtg-0-0"><span data-offset-key="4kbtg-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="a1dnd-0-0"><div class="_1mf _1mj" data-offset-key="a1dnd-0-0"><span data-offset-key="a1dnd-0-0">นักวิจัยหลายท่านเห็นตรงกันว่า การที่โมเดลจะมี commonsense และ mental model ที่ดีมากๆ ได้จะต้องเข้าใจความแตกต่างระหว่างเรื่อง "เหตุและผล vs. การเกิดขึ้นพร้อมๆ กัน" (Causation vs. Correlation) นันคือสิ่งสองอย่างที่มักเกิดขึ้นพร้อมๆ กัน มันเป็นเพราะสิ่งแรกทำให้เกิดสิ่งที่สอง หรือตรงกันข้าม หรือมีปัจจัยที่สามที่ทำให้สองสิ่งนี้เกิด</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="a69pu-0-0"><div class="_1mf _1mj" data-offset-key="a69pu-0-0"><span data-offset-key="a69pu-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="cumqd-0-0"><div class="_1mf _1mj" data-offset-key="cumqd-0-0"><span data-offset-key="cumqd-0-0">ซึ่งโมเดลการเรียนรู้ทางสถิติทั่วไปจะเรียนได้แต่เรื่อง Correlation ไม่ใช่ Causation ทำให้โมเดล Deep Learning ทั่วๆ ไปก็เรียนรู้เรื่อง Causation ได้ยากมากเช่นกัน เป็นต้น</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="4dvn4-0-0"><div class="_1mf _1mj" data-offset-key="4dvn4-0-0"><span data-offset-key="4dvn4-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="9mooc-0-0"><div class="_1mf _1mj" data-offset-key="9mooc-0-0"><span data-offset-key="9mooc-0-0">เรื่องของ commonsense และ mental model ยังว่ากันได้อีกยาว ในบทความนี้ขอเกริ่นไว้แค่นี้ก่อน </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="7riq1-0-0"><div class="_1mf _1mj" data-offset-key="7riq1-0-0"><span data-offset-key="7riq1-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="5a03r-0-0"><div class="_1mf _1mj" data-offset-key="5a03r-0-0"><span data-offset-key="5a03r-0-0">.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1hv7m-0-0"><div class="_1mf _1mj" data-offset-key="1hv7m-0-0"><span data-offset-key="1hv7m-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="83gun-0-0"><div class="_1mf _1mj" data-offset-key="83gun-0-0"><span style="text-decoration: underline"><strong>2. System-2 Integration</strong></span></div></div><div data-offset-key="88d4p-0-0"> </div><div data-offset-key="88d4p-0-0"><div data-offset-key="b96eh-0-0">https://i.ibb.co/jhVb6VL/gpt3-common-2-system2.png</div></div><div data-offset-key="88d4p-0-0"> </div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="bv1jp-0-0"><div class="_1mf _1mj" data-offset-key="bv1jp-0-0"><span data-offset-key="bv1jp-0-0">อีก 1 งานระบือโลกที่ได้รางวัลโนเบล คืองานที่เป็นต้นกำเนิดของ Behavioral Economics หรือเศรษฐศาสตร์พฤติกรรมมนุษย์ที่พิสูจน์ด้วยการทดลองจนทำให้เข้าใจชัดเจนได้ว่ากระบวนการคิดของมนุษย์นั้นควรจะแบ่งออกได้เป็น 2 ระบบ ที่เรียกว่า System-1 และ System-2 </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="304bs-0-0"><div class="_1mf _1mj" data-offset-key="304bs-0-0"><span data-offset-key="304bs-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1ja45-0-0"><div class="_1mf _1mj" data-offset-key="1ja45-0-0"><span data-offset-key="1ja45-0-0">โดย System-1 นั้นก็คือการคิดเร็วๆ ตามสัญชาติญาณของมนุษย์ผ่าน Mental Models ที่ทำให้มนุษย์สามารถคาดเดาเรื่องต่างๆ ได้อย่างรวดเร็วมาก ในขณะที่ System-2 คือการคิดวิเคราะห์อย่างละเอียดผ่านกระบวนการตรรกศาสตร์และคณิตศาสตร์ และความรู้ทางทฤษฏีวิทยาศาสตร์ทั้งหลายที่แม่นยำ ที่พวกเราร่ำเรียนกันมาหลายปีนั่นหละครับ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="abtc3-0-0"><div class="_1mf _1mj" data-offset-key="abtc3-0-0"><span data-offset-key="abtc3-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="5krqd-0-0"><div class="_1mf _1mj" data-offset-key="5krqd-0-0"><span data-offset-key="5krqd-0-0">จากรูปที่ 2 (จากอ้างอิง 4.) คนเราจะสามารถสลับ System-1 (Mental Model) และ System-2 (Conceptual Model) ได้อย่างไม่รู้ตัวเพื่อทำความเข้าใจโลกแห่งความจริง (Physical World) อย่างไรก็ตามโมเดล Deep Learning ในปัจจุบันไม่สามารถนำความรู้ทาง logics / math/ science ที่เรามีอยู่มากมายมาใช้ได้อย่างกลมกลืนเหมือนมนุษย์ครับ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="c0010-0-0"><div class="_1mf _1mj" data-offset-key="c0010-0-0"><span data-offset-key="c0010-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1guud-0-0"><div class="_1mf _1mj" data-offset-key="1guud-0-0"><span data-offset-key="1guud-0-0">ยกตัวอย่างง่ายๆ เช่นให้ GPT-3 บวกเลขให้ดู จะพบว่า GPT-3 อาจจะเก่งตอบการบวกเลขได้ถูกต้องจนถึงเลข 2 หลัก แต่ตั้งแต่เลข 3 หลักเป็นต้นไป ก็จะกลายเป็นเรื่องที่ไม่ง่ายเลย เพราะไม่มีใครมานั่งบรรยายการบวกเลขหลายหลักเป็นตัวหนังสือให้ GPT-3 ได้อ่าน</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="d0v0k-0-0"><div class="_1mf _1mj" data-offset-key="d0v0k-0-0"><span data-offset-key="d0v0k-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="182mf-0-0"><div class="_1mf _1mj" data-offset-key="182mf-0-0"><span data-offset-key="182mf-0-0">ดังนั้นการจะหวังให้ GPT-3 เข้าใจทฤษฎีวิทยาศาสตร์ต่างๆ อย่างลึกซึ่งจึงเป็นไปไม่ได้ ณ ตอนนี้ GPT-3 เพียงอธิบายเรื่องเหล่านี้ได้คร่าวๆ เท่านั้น</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="dgf12-0-0"><div class="_1mf _1mj" data-offset-key="dgf12-0-0"><span data-offset-key="dgf12-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="e8ead-0-0"><div class="_1mf _1mj" data-offset-key="e8ead-0-0"><span data-offset-key="e8ead-0-0">ได้มีงานวิจัยกลุ่ม Multi-hop reasoning ได้มีความพยายามเบื้องต้นที่จะทำให้โมเดลสามารถคิดได้เป็นเหตุผลมากขึ้น ด้วยการนำข้อมูลจากหลายๆ documents มาต่อๆ กันก่อนสร้าง output แต่ก็ยังทำได้แต่กรณีง่ายๆ บางกรณีเท่านั้นครับ </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="9mlr-0-0"><div class="_1mf _1mj" data-offset-key="9mlr-0-0"><span data-offset-key="9mlr-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="92qtg-0-0"><div class="_1mf _1mj" data-offset-key="92qtg-0-0"><span data-offset-key="92qtg-0-0">.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="6op-0-0"><div class="_1mf _1mj" data-offset-key="6op-0-0"><span data-offset-key="6op-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="cl39g-0-0"><div class="_1mf _1mj" data-offset-key="cl39g-0-0"><span style="text-decoration: underline"><strong>3. Continual หรือ Life-long Learning</strong></span></div></div><div data-offset-key="duh9f-0-0"> </div><div data-offset-key="duh9f-0-0">https://i.ibb.co/1qtF4Wh/3-forgetting.png</div><div data-offset-key="duh9f-0-0"> </div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1p0go-0-0"><div class="_1mf _1mj" data-offset-key="1p0go-0-0"><span data-offset-key="1p0go-0-0">อีกปรากฏการณ์ที่เป็นปัญหามากๆ ของโมเดล Deep Learning ก็คือปรากฏการณ์ที่เรียกว่า "การหลงลืม" ซึ่งมีทั้ง </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="74gv5-0-0"><div class="_1mf _1mj" data-offset-key="74gv5-0-0"><span data-offset-key="74gv5-0-0"> - "การหลงลืมอย่างสิ้นเชิง" (Catastrophic Forgetting) ซึ่งก็คือเวลาให้โมเดลเรียนรู้เรื่องใหม่ผ่านการ Finetuning ก็จะทำให้ลืมเรื่องเก่าๆ ไปเกือบหมด (นั่นคือความแม่นยำของงานเก่าลดลงอย่างมาก) และ </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ai9h1-0-0"><div class="_1mf _1mj" data-offset-key="ai9h1-0-0"><span data-offset-key="ai9h1-0-0"> - "การหลงลืมว่าเคยเขียนอะไรไป" ซึ่งเป็นการหลงลืมเฉพาะของโมเดลที่้ เน้นการเขียนอย่าง GPT-3 ซึ่งมีกระบวนการเขียนด้วยการสุ่มคำตามความน่าจะเป็น ทำให้คำตอบนั้นเปลี่ยนไปเปลี่ยนมาอยู่ตลอดตามการสุ่ม แม้จะไม่ได้เรียนรู้อะไรใหม่ๆ ก็ตาม</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="84ib8-0-0"><div class="_1mf _1mj" data-offset-key="84ib8-0-0"><span data-offset-key="84ib8-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ac5jh-0-0"><div class="_1mf _1mj" data-offset-key="ac5jh-0-0"><span data-offset-key="ac5jh-0-0">ภาพที่ 3 เป็นตัวอย่างนึงที่อธิบายคร่าวๆ ได้ว่าทำไมปรากฏการณ์ "การหลงลืมอย่างสิ้นเชิง" จึงเกิดขึ้น (นำมาจากอ้างอิง 5)</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="puk2-0-0"><div class="_1mf _1mj" data-offset-key="puk2-0-0"><span data-offset-key="puk2-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="6rk6t-0-0"><div class="_1mf _1mj" data-offset-key="6rk6t-0-0"><span data-offset-key="6rk6t-0-0">ได้มีงานวิจัยหลายงานในฝั่ง Computer Vision พยายามแก้ประเด็นการหลงลืมโดยสิ้นเชิงทำให้เกิดงานวิจัยกลุ่มย่อยใหม่ๆ ที่เรียกว่า Continual Learning, Life-long Learning และ Learning without Forgetting แต่ยังไม่เห็นชัดๆ ในงานฝั่ง Transformers ที่จะสามารถนำมาใช้กับ GPT-3 ได้โดยตรงครับ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1hn6i-0-0"><div class="_1mf _1mj" data-offset-key="1hn6i-0-0"><span data-offset-key="1hn6i-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1lvkm-0-0"><div class="_1mf _1mj" data-offset-key="1lvkm-0-0"><span data-offset-key="1lvkm-0-0">.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="c1lg7-0-0"><div class="_1mf _1mj" data-offset-key="c1lg7-0-0"><span data-offset-key="c1lg7-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="9n2k2-0-0"><div class="_1mf _1mj" data-offset-key="9n2k2-0-0"><span style="text-decoration: underline"><strong>4. &amp; 5. Vision &amp; Reinforcement Integration</strong></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="dd2f7-0-0"><div class="_1mf _1mj" data-offset-key="dd2f7-0-0"> </div><div data-offset-key="dd2f7-0-0"> </div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="869u5-0-0"><div class="_1mf _1mj" data-offset-key="869u5-0-0"><div data-offset-key="duh9f-0-0">https://i.ibb.co/CJSJh8f/4-visual-comet.png</div></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="a6f55-0-0"><div data-offset-key="a6f55-0-0"> </div><div class="_1mf _1mj" data-offset-key="a6f55-0-0"><span data-offset-key="a6f55-0-0">แน่นอน การเรียนรู้อย่างน้อยครึ่งนึงของชีวิตมนุษย์นั้นเป็นการเรียนรู้ผ่านการมองเห็น มีหลายๆ เหตุการณ์ที่อธิบายเป็นคำพูดได้ยาก แต่เข้าใจง่ายๆ สำหรับเราเมื่อเราเห็น ยกตัวอย่างดังที่โชว์ในรูปที่ 4 เพียงรูปเดียวคนเราสามารถตีความอะไรได้หลายอย่าง</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="42ueq-0-0"><div class="_1mf _1mj" data-offset-key="42ueq-0-0"><span data-offset-key="42ueq-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="64cdl-0-0"><div class="_1mf _1mj" data-offset-key="64cdl-0-0"><span data-offset-key="64cdl-0-0">งานวิจัย Visual Commonsense ของทีม AI2 (อ้างอิง 6) มีความพยายามที่จะเชื่อมงาน vision เข้ากับงาน commonsense ซึ่งยังเพิ่งเริ่มต้นมาได้ไม่นาน ยังต้องพัฒนาอีกไกลครับ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="5ko26-0-0"><div class="_1mf _1mj" data-offset-key="5ko26-0-0"><span data-offset-key="5ko26-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="e6jgn-0-0"><div class="_1mf _1mj" data-offset-key="e6jgn-0-0"><span data-offset-key="e6jgn-0-0">นอกจากจะมองเห็นแล้ว คนเรายังเรียนรู้ลองผิดลองถูกได้ด้วยตัวเองโดยไม่ต้องมีผู้สอนได้อีกด้วย ซึ่งจะใกล้เคียงกับ Reinforcement Learning ที่ยังไม่ถูกรวมอยู่ใน Language Models ทั่วไปรวมทั้ง GPT-3 ครับ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="3nndl-0-0"><div class="_1mf _1mj" data-offset-key="3nndl-0-0"><span data-offset-key="3nndl-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="23oa5-0-0"><div class="_1mf _1mj" data-offset-key="23oa5-0-0"><span data-offset-key="23oa5-0-0">การขาดการมองเห็น สามัญสำนึก และทักษะการลองผิดลองถูกผ่านประสาทสัมผัสต่างๆ เป็นจุดอ่อนที่สำคัญของ GPT-3 </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="62c0u-0-0"><div class="_1mf _1mj" data-offset-key="62c0u-0-0"><span data-offset-key="62c0u-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="9p0sd-0-0"><div class="_1mf _1mj" data-offset-key="9p0sd-0-0"><span data-offset-key="9p0sd-0-0">.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="1t535-0-0"><div class="_1mf _1mj" data-offset-key="1t535-0-0"><span data-offset-key="1t535-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="6i4s7-0-0"><div class="_1mf _1mj" data-offset-key="6i4s7-0-0"><span style="text-decoration: underline"><strong>6. Long-range Reasoning / Long-term goal planning</strong></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="e1kf8-0-0"><div class="_1mf _1mj" data-offset-key="e1kf8-0-0"><span data-offset-key="e1kf8-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="c2uj5-0-0"><div class="_1mf _1mj" data-offset-key="c2uj5-0-0"><span data-offset-key="c2uj5-0-0">ปัจจุบัน GPT-3 เวอร์ชั่นดีที่สุดสามารถอ่านข้อมูลได้ยาวที่สุด 2048 tokens เท่านั้น (น้อยกว่า 1,000 คำ) ซึ่งทำให้ยังไม่สามารถเชื่อมโยงเหตุผล ของหนังสือเล่มใหญ่ๆ หลายพันหน้าเหมือนที่มนุษย์อ่านได้</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="ngoq-0-0"><div class="_1mf _1mj" data-offset-key="ngoq-0-0"><span data-offset-key="ngoq-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="f6dpc-0-0"><div class="_1mf _1mj" data-offset-key="f6dpc-0-0"><span data-offset-key="f6dpc-0-0">นอกจากนี้การให้ GPT-3 ให้เหตุผลหรือเขียนบรรยายเรื่องราวต่างๆ ที่สอดคล้องกันเป็นเอกสารยาวๆ </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="fpv26-0-0"><div class="_1mf _1mj" data-offset-key="fpv26-0-0"><span data-offset-key="fpv26-0-0">เช่น การแต่งหนังสือหลายๆ บทโดยมีเป้าหมายที่สอดคล้องกัน และนำไปสู่บทสรุปตามที่ตั้งไว้ตั้งแต่แรกก็ยังเป็นเรื่องที่ท้าทายเป็นอย่างมาก</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="9otfn-0-0"><div class="_1mf _1mj" data-offset-key="9otfn-0-0"><span data-offset-key="9otfn-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="5anjq-0-0"><div class="_1mf _1mj" data-offset-key="5anjq-0-0"><span data-offset-key="5anjq-0-0">.</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="derbk-0-0"><div class="_1mf _1mj" data-offset-key="derbk-0-0"><span data-offset-key="derbk-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="7oo6p-0-0"><div class="_1mf _1mj" data-offset-key="7oo6p-0-0"><span style="text-decoration: underline"><strong>7. Precise &amp; Creative Thinking / Writing</strong></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="2njsl-0-0"><div class="_1mf _1mj" data-offset-key="2njsl-0-0"><span data-offset-key="2njsl-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="47n2f-0-0"><div class="_1mf _1mj" data-offset-key="47n2f-0-0"><span data-offset-key="47n2f-0-0">หนึ่งในความท้าทายสูงสุดของการเขียนระดับ AGI ที่ยังห่างไกล GPT-3 มากๆ นั่นคือการแต่งเรื่องให้สอดคล้องกันในระดับสูงสุด รวมทั้งแต่งอย่างมีความคิดสร้างสรรค์สูงไปพร้อมๆ กันโดยไม่ออกทะเล </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="9n1c3-0-0"><div class="_1mf _1mj" data-offset-key="9n1c3-0-0"><span data-offset-key="9n1c3-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="7qs23-0-0"><div class="_1mf _1mj" data-offset-key="7qs23-0-0"><span data-offset-key="7qs23-0-0">ตัวอย่างแรกที่คนทำได้คือการสร้างนิยาย นักสืบซึ่งในการแต่งนิยายประเภทนี้ต้องมีการสร้างปมขึ้นมาหลายปมอย่างสร้างสรรค์ และขมวดปมแต่ละปมอย่างมีเหตุผล มุ่งไปสู่บทสรุปที่เป็นไปได้เพียงอย่างเดียวเท่านั้น</span></div><div data-offset-key="7qs23-0-0"> </div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="4g3a7-0-0"><div class="_1mf _1mj" data-offset-key="4g3a7-0-0"><div data-offset-key="duh9f-0-0">https://i.ibb.co/7CwjF7S/5-conan.png</div></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="978sf-0-0"><div data-offset-key="978sf-0-0"> </div><div class="_1mf _1mj" data-offset-key="978sf-0-0"><span data-offset-key="978sf-0-0">ถ้า GPT-X สามารถแต่งนิยายนักสืบระดับเชอร์ล็อคโฮมหรือโคนันได้เมื่อไร เราก็สามารถนำ GPT-X เหล่านั้นมาอ่านข้อมูลของคดีจริงๆ และสร้างสมมติฐานที่จะใช้ไขคดีที่เกิดขึ้นในชีวิตจริงได้ครับ</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="22qdb-0-0"><div class="_1mf _1mj" data-offset-key="22qdb-0-0"><span data-offset-key="22qdb-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="f9nl7-0-0"><div class="_1mf _1mj" data-offset-key="f9nl7-0-0"><span data-offset-key="f9nl7-0-0">อีกหนึ่งตัวอย่างความคิดสร้างสรรค์ที่มีประโยชน์มากๆ คืออีกแนวคิดของเศรษฐศาสตร์พฤติกรรมที่เรียกว่า Nudge ที่เป็นศาสตร์ที่อาศัยความเข้าใจมนุษย์อย่างลึกซึ้งและทำให้รัฐบาลสามารถออกนโยบายต่างๆ ที่จูงใจคนเราให้ทำตามได้อย่างไม่น่าเชื่อ ไม่ว่าจะเป็นสร้างระบบเพื่อกระตุ้นให้คนอนุรักษ์สัตว์ป่าใกล้สูญพันธุ์ หรือกระตุ้นให้ผู้เสียชีวิตบริจาคอวัยวะให้มูลนิธิทางการแพทย์ เป็นต้น (ดูอ้างอิง 7)</span></div></div><div data-offset-key="61ds9-0-0"> </div><div data-offset-key="61ds9-0-0"><div data-offset-key="duh9f-0-0">https://i.ibb.co/Bnt3bmX/6-nudge.png</div><div data-offset-key="duh9f-0-0"> </div></div><div data-offset-key="61ds9-0-0"> </div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="8j4mk-0-0"><div class="_1mf _1mj" data-offset-key="8j4mk-0-0"><span data-offset-key="8j4mk-0-0">ซึ่งผมได้ทดลองให้ GPT-3 เรียนรู้การออกแบบ Nudge ง่ายๆ แบบ Few-shots และทดลองให้ GPT-3 สร้าง Nudge Policy ตามเป้าหมายที่กำหนด ซึ่งจากการทดลองเบื้องต้น GPT-3 ยังไม่ประสบความสำเร็จในการออกแบบความคิดสร้างสรรค์ที่ต้องสมเหตุผลนี้ครับ </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="a2ook-0-0"><div class="_1mf _1mj" data-offset-key="a2ook-0-0"><span data-offset-key="a2ook-0-0"> </span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="aeti5-0-0"><div class="_1mf _1mj" data-offset-key="aeti5-0-0"><span data-offset-key="aeti5-0-0">===</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="dbist-0-0"><div class="_1mf _1mj" data-offset-key="dbist-0-0"><em><strong>อ้างอิง </strong></em></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="513jo-0-0"><div class="_1mf _1mj" data-offset-key="513jo-0-0"><span data-offset-key="513jo-0-0">===</span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="41irb-0-0"><div class="_1mf _1mj" data-offset-key="41irb-0-0"><span data-offset-key="41irb-0-0">1) LaMBDA : </span><span class="py34i1dx"><span data-offset-key="41irb-1-0">https://www.theverge.com/2021/5/18/22442328/google-io-2021-ai-language-model-lamda-pluto</span></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="4k5ss-0-0"><div class="_1mf _1mj" data-offset-key="4k5ss-0-0"><span data-offset-key="4k5ss-0-0">2) COMET+ATOMIC : </span><span class="py34i1dx"><span data-offset-key="4k5ss-1-0">https://arxiv.org/abs/2010.05953</span></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="465aq-0-0"><div class="_1mf _1mj" data-offset-key="465aq-0-0"><span data-offset-key="465aq-0-0">3) Elemental Cognition : </span><span class="py34i1dx"><span data-offset-key="465aq-1-0">https://ec.ai/blog</span></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="eborb-0-0"><div class="_1mf _1mj" data-offset-key="eborb-0-0"><span data-offset-key="eborb-0-0">4) </span><span class="py34i1dx"><span data-offset-key="eborb-1-0">https://www.researchgate.net/publication/253847244_Notes_for_a_Modeling_Theory_of_Science_Cognition_and_Instruction</span></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="c77gc-0-0"><div class="_1mf _1mj" data-offset-key="c77gc-0-0"><span data-offset-key="c77gc-0-0">5) Attention-based Selective Plasticity : </span><span class="py34i1dx"><span data-offset-key="c77gc-1-0">https://arxiv.org/pdf/1903.06070.pdf</span></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="9mupl-0-0"><div class="_1mf _1mj" data-offset-key="9mupl-0-0"><span data-offset-key="9mupl-0-0">6) VisualCOMET : </span><span class="py34i1dx"><span data-offset-key="9mupl-1-0">https://arxiv.org/pdf/2004.10796.pdf</span></span></div></div><div class="" data-block="true" data-editor="8sgpi" data-offset-key="bti15-0-0"><div class="_1mf _1mj" data-offset-key="bti15-0-0"><span class="py34i1dx"><span data-offset-key="bti15-0-0">https://www.investing.in.th/product/247927-126542/%E0%B8%AA%E0%B8%B0%E0%B8%81%E0%B8%94%E0%B8%84%E0%B8%A7%E0%B8%B2%E0%B8%A1%E0%B8%84%E0%B8%B4%E0%B8%94-%E0%B8%AA%E0%B8%B0%E0%B8%81%E0%B8%B4%E0%B8%94%E0%B8%9E%E0%B8%A4%E0%B8%95%E0%B8%B4%E0%B8%81%E0%B8%A3%E0%B8%A3%E0%B8%A1-%E0%B8%89%E0%B8%9A%E0%B8%B1%E0%B8%9A%E0%B8%9B%E0%B8%A3%E0%B8%B1%E0%B8%9A%E0%B8%9B%E0%B8%A3%E0%B8%B8%E0%B8%87-nudge</span></span></div></div>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-693</guid>
                    </item>
				                    <item>
                        <title>RE: ว่าด้วยเรื่อง GPT2 &amp; 3 และ OpenAI API (Update GPT3 เมษายน 2021 และ GPT2 Workshop เมษายน 2020)</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-692</link>
                        <pubDate>Tue, 06 Jul 2021 03:20:09 +0000</pubDate>
                        <description><![CDATA[GPT-J-6B ประสิทธิภาพสูสีกับ GPT-3 Curie (ตัวรองท้อป) พร้อมให้ดาวโหลดมาใช้งานแล้ว!--------------- โมเดล GPT-J-6B นี้ implement บน Jax ซึ่งเป็น Deep Learning library มาแรงโดยสามารถทำ Autograd ...]]></description>
                        <content:encoded><![CDATA[<div class="kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q"><div dir="auto"><span style="text-decoration: underline;font-size: 18pt"><strong>GPT-J-6B ประสิทธิภาพสูสีกับ GPT-3 Curie (ตัวรองท้อป) พร้อมให้ดาวโหลดมาใช้งานแล้ว!</strong></span></div><div dir="auto">---------------</div><div dir="auto"> </div></div><div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q"><div dir="auto">โมเดล GPT-J-6B นี้ implement บน Jax ซึ่งเป็น Deep Learning library มาแรงโดยสามารถทำ Autograd และ XLA ได้โดยใช้คำสั่งแบบเดียวกับ Numpy ทำให้ง่ายต่อการใช้งานกว่า Tensorflow หรือ Pytorch</div></div><div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q"><div dir="auto">GPT-J-6B Github</div><div dir="auto"><a class="oajrlxb2 g5ia77u1 qu0x051f esr5mh6w e9989ue4 r7d6kgcz rq0escxv nhd2j8a9 nc684nl6 p7hjln8o kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x jb3vyjys rz4wbd8a qt6c0cv9 a8nywdso i1ao9s8h esuyzwwr f1sip0of lzcic4wl py34i1dx gpro0wi8" role="link" href="https://github.com/kingoflolz/mesh-transformer-jax/?fbclid=IwAR0NFNGNBnJ9-ntAXK-f9Kx4Zj4PyiF1K1U9dG8EH0DH2oBnj69n6-CrXD4" target="_blank" rel="nofollow noopener">https://github.com/kingoflolz/mesh-transformer-jax/</a></div></div><div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql ii04i59q"><div dir="auto">มีพารามิเตอร์ราว 6 พันล้านตัวแปร (6B) มี 28 layers ใช้คำศัพท์และตัว token แบบเดียวกับ GPT2 และ GPT3 โดยเทรนบน Google Cloud TPU บน dataset "The Pile (2020)" ขนาด 825 GB</div><div dir="auto">Colab demo : <a class="oajrlxb2 g5ia77u1 qu0x051f esr5mh6w e9989ue4 r7d6kgcz rq0escxv nhd2j8a9 nc684nl6 p7hjln8o kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x jb3vyjys rz4wbd8a qt6c0cv9 a8nywdso i1ao9s8h esuyzwwr f1sip0of lzcic4wl py34i1dx gpro0wi8" role="link" href="https://colab.research.google.com/github/kingoflolz/mesh-transformer-jax/blob/master/colab_demo.ipynb?fbclid=IwAR02hde4egjoNv_LlQFEBk1drkhX1jTWkg4h7-4WYupRbOVtPaEdPASIJXc" target="_blank" rel="nofollow noopener">http://colab.research.google.com/.../master/colab_demo.ipynb</a></div><div dir="auto">Web demo : <a class="oajrlxb2 g5ia77u1 qu0x051f esr5mh6w e9989ue4 r7d6kgcz rq0escxv nhd2j8a9 nc684nl6 p7hjln8o kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x jb3vyjys rz4wbd8a qt6c0cv9 a8nywdso i1ao9s8h esuyzwwr f1sip0of lzcic4wl py34i1dx gpro0wi8" role="link" href="https://l.facebook.com/l.php?u=https%3A%2F%2F6b.eleuther.ai%2F%3Ffbclid%3DIwAR3pzEz49qBq_ABDMbrTk1kNRrsVFThBnkzWPSMgSbrm5i6rwYn8qe6dFcA&amp;h=AT27WP5mvV2wtjVj7qNacf3rrs6Pkk9WiZ2IJ0E5-DXIvqEHgQY2NWyAbOIOZ9tQoNiVIMTk3s0uvs3Sc__cSqDQen8TOp1vw7Kt4pavmGYFJ1CkilP3I64-MWAUGyFWl-0X7i7X-XPW4i3KD2LR&amp;__tn__=-UK-R&amp;c=AT12Q2LAw8qXWdEat6akWUv_pRre2D8YeBs8gev7klYznc3IC8k5G9cXaeayiGqPezg1TeaeTlKOue-FWz6gaFFa_HDSwPASMRopsg-IKGPDyYv_TGFQYh87TnSQfv-ICr92_JM678uMm5gIVeMGO9f9oMOljSfFXX-YpCZ5LhW_qleOS5P4On7kD3EioYMA0PF_F1M" target="_blank" rel="nofollow noopener">https://6b.eleuther.ai/</a></div><div dir="auto">Blog post : <a class="oajrlxb2 g5ia77u1 qu0x051f esr5mh6w e9989ue4 r7d6kgcz rq0escxv nhd2j8a9 nc684nl6 p7hjln8o kvgmc6g5 cxmmr5t8 oygrvhab hcukyx3x jb3vyjys rz4wbd8a qt6c0cv9 a8nywdso i1ao9s8h esuyzwwr f1sip0of lzcic4wl py34i1dx gpro0wi8" role="link" href="https://arankomatsuzaki.wordpress.com/2021/06/04/gpt-j/?fbclid=IwAR0ApFKFNQ7w52_lTHCM7pSgKo_VZzx89eeMBsS7JGRlpe9sxjy6ZPljltk" target="_blank" rel="nofollow noopener">https://arankomatsuzaki.wordpress.com/2021/06/04/gpt-j/</a></div></div>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-692</guid>
                    </item>
				                    <item>
                        <title>RE: ว่าด้วยเรื่อง GPT2 &amp; 3 และ OpenAI API (Update GPT3 เมษายน 2021 และ GPT2 Workshop เมษายน 2020)</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-450</link>
                        <pubDate>Fri, 09 Apr 2021 00:51:44 +0000</pubDate>
                        <description><![CDATA[ใช้งาน OpenAI API และ GPT3 อย่างเป็นทางการ!!ThaiKeras and Kaggle - 8 เมษายน 2021 สวัสดีครับเพื่อนๆ หลังจากที่เราได้เล่า applications เจ๋งๆ ของ GPT3 ในบทความเดือนก่อ ทาง ThaiKeras ก็ได้รับ su...]]></description>
                        <content:encoded><![CDATA[<p><span style="text-decoration: underline;font-size: 24pt"><strong>ใช้งาน OpenAI API และ GPT3 อย่างเป็นทางการ!!</strong></span></p><p><em>ThaiKeras and Kaggle - 8 เมษายน 2021</em></p><p> </p><p>สวัสดีครับเพื่อนๆ หลังจากที่เราได้เล่า applications เจ๋งๆ ของ GPT3 ในบทความเดือนก่อน</p><p><a href="http://bit.ly/thaikeras-openai-gpt">http://bit.ly/thaikeras-openai-gpt</a>  ทาง ThaiKeras ก็ได้รับ surprise จาก OpenAI ที่อนุญาตให้เราทดลองใช้งาน GPT3 ได้อย่างเป็นทางการครับ!! (หลังจากที่รออยู่ใน waitlist น่าจะเกิน 6 เดือน)</p><p>โดย GPT3 ที่ OpenAI ให้นักพัฒนาใช้งานนั้นจะอยู่ในชื่อเรียกว่า OpenAI API ดูจากชื่อนี้ประกอบกับหัวข้อสนทนาใน OpenAI community คาดว่าน่าจะมีบริการอื่นนอกจาก GPT3 (เช่น Dall-E <a href="https://openai.com/blog/dall-e/">https://openai.com/blog/dall-e/</a> ) ออกมาให้นักพัฒนาได้ใช้ในอนาคตอันใกล้นี้ครับ</p><p>ล่าสุดทาง OpenAI แจ้งว่าได้เปิด API นี้ให้นักพัฒนากว่า 50,000 รายทั่วโลกได้ใช้งานแล้ว และวันนี้ทีม ThaiKeras จะลองพาเพื่อนๆ ไปดูว่า Ecosystem ของ Open AI เป็นอย่างไรบ้าง และมีค่าบริการ pricing ในการใช้งานอย่างไร  ในกรณีที่เพื่อนๆ มีไอเดียจะประยุกต์ GPT3 เข้ากับธุรกิจหรือ Startup ด้านต่างๆ</p><p>สำหรับผู้ที่สนใจเรื่องค่าใช้จ่ายในการใช้งาน GPT3 หรือ OpenAI API สามารถเลื่อนลงไปดูในท้ายบทความได้เลยครับ</p><p>GPT3 เป็นโมเดลด้านภาษาที่เก่งที่สุดในเรื่อง "การเขียน" (แต่ไม่ใช่โมเดลที่ฉลาดที่สุดในแง่ "การอ่าน" ดังที่เราเคยเล่าในบทความเจาะลึกโมเดล NLP <a href="https://bit.ly/thaikeras-understanding-nlp">https://bit.ly/thaikeras-understanding-nlp</a> เว้นเสียแต่เราพิจารณาการอ่านแบบ few-shots  ซึ่ง  GPT3 น่าจะเก่งที่สุด) และนับว่าเป็นหนึ่งในโมเดลที่ฉลาดที่สุดเท่าที่มีมาในวงการ AI</p><p>โดยเราสามารถให้ GPT3 เขียนเรื่องราวสร้างสรรค์เรื่องราวอะไรก็ได้เหมือนกับมนุษย์ โดยใช้ภาษาอังกฤษเป็นสื่อกลาง หรือจะใช้ภาษาไทยผ่าน Translator API ก็ย่อมได้ (ตัวอย่าง <a href="https://bit.ly/thaikeras-kaggle-gpt2thai">https://bit.ly/thaikeras-kaggle-gpt2thai</a> )  ดังนั้นน่าสนใจมากๆ ภาคธุรกิจหรือ Startup ในบ้านเราจะสามารถนำพลังของ GPT3 มาประยุกต์ได้อย่างไรบ้าง</p><p>.</p><p><span style="text-decoration: underline"><strong>รู้จัก Zero-shot กับ Few-shots และงานที่ GPT3 ทำได้</strong></span></p><p>หลักการการใช้งานของ GPT3 ผ่าน OpenAI API นั้นถือว่าเรียบง่ายมากๆ ครับเรียกว่าเป็น "Text-In Text-Out" คือเรากำหนด Input Texts  หรือเรื่องราวเบื้องต้นส่งไปให้ทาง OpenAI Server เค้าก็จะส่ง Texts ที่ GPT3 แต่งต่อจาก Input ของเรากลับมาให้</p><p>โดย OpenAI ได้ให้ตัวอย่างงานต่างๆ ที่ GPT3 ทำได้เกือบ 50 ตัวอย่าง ดังแสดงในรูปที่ 1 ครับ ซึ่งมีตั้งแต่งานง่ายๆ เช่น จำแนกประเภทประโยค  แก้ Grammar  นำข้อมูลสำคัญออกจากข้อความ  หรืองานยากๆ เช่น ChatBot   เปลี่ยนภาษามนุษย์เป็นภาษาโปรแกรม  หรือเขียนนิยายสยองขวัญ เป็นต้น</p><p><img src="https://i.ibb.co/jHWL810/all-examples.jpg" /></p><p> </p><p>GPT3 นั้นฉลาดมาก โดยการทำงานอยู่บนหลักการที่เรียกว่า Zero-shot หรือ Few-shots ซึ่งเป็นปัญหาที่ยากมากๆ ในวงการ Machine Learning ซึ่งโดยปกติต้องการข้อมูลสอนมหาศาล</p><p>คำว่า Few-shots คือสอนโดยให้แค่ไม่กี่ตัวอย่าง (ใช้นิ้วมือนับได้) ส่วน Zero-shot คือการสอนโดยไม่ต้องให้ตัวอย่างใดๆ เลย!! ซึ่งเป็นปัญหาที่ยากมากๆ แต่ GPT3 ทำได้ดีมากๆ  นับว่าเป็น practical solution ของปัญหาที่ยากมากๆ ปัญหานึงในวงการ AI</p><p>Zero-shot หมายถึง เราสั่งให้มันทำงานที่ต้องการได้โดยที่ไม่ต้องสอนอะไรเลย อาทิเช่น เราให้บทความยาวๆ ไปแล้วบอกให้ GPT3 "สรุปประเด็นสำคัญ" ให้โดยที่ไม่สอนว่า "สรุปประเด็นสำคัญ" นั้นแปลว่าอะไร ซึ่ง GPT3 สามารถทำงานประเภทนี้ได้ทันที (ฉลาดสุดๆ) เนื่องจาก GPT3 ได้อ่าน Texts ต่างๆ ที่มีอยู่ในโลกนี้เป็นปริมาณมหาศาล ทำให้เข้าใจความหมายของคำว่า "สรุปประเด็นสำคัญ" อยู่แล้ว</p><p>อย่างไรก็ดี "ประเด็นสำคัญ" ของผู้ใช้งานแต่ละคนอาจไม่เหมือนกัน บางคนอาจสนใจที่เหตุการณ์ บางคนอาจสนใจที่ตัวบุคคล หรืออื่นๆ ดังนั้น GPT3 จะสามารถทำงานได้ดีมากขึ้นไปอีกถ้าเราให้ตัวอย่าง "การสรุปประเด็นสำคัญ" สัก 2-3 ตัวอย่าง (Few shots) ว่าผู้ใช้งานต้องการสรุปประมาณไหน</p><p>ซึ่ง GPT3 ก็จะปรับสไตล์การสรุปให้เข้ากับสิ่งที่เราต้องการได้ทันที!!</p><p> </p><p> </p><p><span style="text-decoration: underline"><strong>ลองเล่น OpenAI ผ่าน Playground</strong></span></p><p>โดยก่อนที่เราจะเขียน Application และเรียกใช้งาน API ผ่าน server เราสามารถลองเล่น GPT3 ได้ผ่าน playground ที่ OpenAI ทำไว้ให้ครับ (รูปที่ 2 -- Few-shots QA ChatBot) </p><p><img src="https://i.ibb.co/xHgH06m/playground-exmaple-qa.jpg" /></p><p> </p><p>ซึ่งเจ้า Playground นี้สามารถ import ตัวอย่าง 50 ตัวอย่างที่ OpenAI เตรียมไว้มาปรับเล่นได้ทันที</p><p>และเป็นโอกาสที่ดีที่จะให้เราได้ลองปรับ Options ต่างๆ ได้ด้วย โดย Option ที่สำคัญมีดังต่อไปนี้</p><ol><li>Engine -- มีให้เลือก 4 Engines คือ Davinci (ใหญ่ที่สุด ดีที่สุด แพงที่สุด) Curie Babbage และ Ada (เล็กที่สุด เร็วที่สุด ถูกที่สุด) โดย OpenAI มี document สอน use case ไว้ว่างานแบบไหนควรใช้ Engine แบบไหน</li><li>Response Length -- ความยาว tokens สูงสุดที่ GPT3 จะตอบกลับมาหาเราได้</li><li>Temperature และ TopP ใช้กำหนด "ความคิดสร้างสรรค์" ของโมเดล โดยถ้าสองค่านี้มากโมเดลจะมีความคิดสร้างสรรค์มาก แต่ในขณะเดียวกันอาจจะออกทะเลได้ง่ายๆ เหมือนกัน</li><li>Frequency Penalty -- ปรับค่านี้เพื่อให้โมเดลตัดการพูดซ้ำเรื่องๆ เดิมๆ ออกไป</li><li>Stop Sequences -- กำหนด tokens ที่จะทำให้โมเดลจบการสร้าง texts</li><li>Show Probabilities -- แสดงผลความน่าจะเป็นของแต่ละ tokens ที่ถูก generate ออกมาว่าความน่าจะเป็นมาก (แม่นยำ) หรือน้อย (สร้างสรรค์)</li></ol><p> </p><p>รูปที่ 3 แสดงตัวอย่างการให้ texts บทความเกี่ยวกับดาวพลูโตแบบ zero-shot และสั่งให้ GPT3 สรุปใจความสำคัญมา 8 ข้อ ส่วนรูป 4 แสดงตัวอย่าง output ที่ได้พร้อมสีความน่าจะเป็นครับ (สีเขียวความน่าจะเป็นมาก สีแดงความน่าจะเป็นน้อย)</p><p> </p><p><img src="https://i.ibb.co/dJtDtVX/playground-pluto-analyze.jpg" /></p><p><br />https://i.ibb.co/KVdN6p6/pluto-result-curie.png</p><p> </p><p>.</p><p> </p><p><span style="text-decoration: underline"><strong>Supports ของ OpenAI ในการพัฒนาและ Deployment</strong></span></p><p>https://i.ibb.co/ZRQz8FN/openai-slack.jpg<br /><br /></p><p>เมื่อเราได้เข้าใช้งาน GPT3 อย่างเป็นทางการ เราจะสามารถพูดคุยกับเพื่อนๆ หรือทีมของ OpenAI ได้ผ่านทาง Slack หรือผ่านทาง Discord community ดังรูปที่ 5 ครับ ซึ่งคึกคักมากทีเดียว</p><p>เมื่อเราพัฒนาไอเดียบน Playground และพัฒนา Application จนน่าจะใช้งานจริงได้แล้ว อย่าเพิ่งเปิดให้ใช้งานครับ!!! เพราะ OpenAI กำหนดว่าทุก Application จะต้องผ่านการรีวิวจาก OpenAI ก่อน มิเช่นนั้นจะถูกตัดสิทธิการเข้าถึงโดยถาวรครับ</p><p>ทั้งนี้เนื่องจากว่า GPT3 นั้นสร้างสรรค์เรื่องต่างๆ ได้ทุกเรื่อง และในบางครั้งถ้าไม่มีการควบคุมที่เหมาะสมก็อาจจะสร้างสรรค์เนื้อเรื่องที่ หยาบคาย เหยียด ลวนลามหรือเรื่องที่ไม่เหมาะสมอื่นๆ ได้</p><p>โดย OpenAI กำหนดว่าการใช้งานช่วงทดลอง ห้ามเผยแพร่ผ่าน Public URL และมีผู้ทดลองใช้งานได้ไม่เกิน 5 คน</p><p>ใน Documentations OpenAI จะมีอธิบายกระบวนการรีวิวอย่างละเอียด รวมทั้งมีตัวอย่างของ Application ที่ไม่ผ่านการรีวิวแน่นอน เช่น Chatbot ที่สามารถ "คุยได้ทุกเรื่อง" (หมายรวมถึงเรื่องหยาบด้วย)</p><p> </p><p> </p><p><span style="text-decoration: underline"><strong>ค่าบริการในการใช้งาน GPT3 ผ่าน OpenAI API</strong></span></p><p>ปัจจุบัน GPT3 มีให้เลือก 4 โมเดล โดยยิ่ง parameters เยอะยิ่งมีความสามารถในการเขียนที่สูง</p><p>โมเดล Davinci (175 Billion parameters)    0.06 เหรียญ / 1,000 tokens</p><p>โมเดล Curie (13 Billion parameters)         0.006 เหรียญ / 1,000 tokens</p><p>โมเดล Babbage (6.7 Billion parameters)  0.0012 เหรียญ / 1,000 tokens</p><p>โมเดล Ada (2.6 Billion parameters)          0.0008 เหรียญ / 1,000 tokens</p><p> </p><p>หมายเหตุ</p><ul><li>Billion = พันล้าน , 175 Billion = 175,000 ล้าน</li><li>GPT3 จะแบ่ง 1 คำในประโยคภาษาอังกฤษออกเป็น 1-4 tokens โดยเฉลี่ยแล้ว 1 คำจะประมาณ 1.5 tokens</li><li>GPT3 ประมวลผลได้สูงสุด (อ่าน + เขียน) ได้ไม่เกิน 2,048 tokens หรือราวๆ 1,500 คำ ต่อการเรียกใช้งาน 1 ครั้ง ดังนั้นการใช้งานเต็มที่ 1 ครั้งในโมเดล Davinci ตกราวๆ 3-4 บาท หรือถ้าใช้โมเดล Curie ก็จะตกราวๆ 30-40 สตางค์</li><li>งานเขียนที่ใช้ความคิดสร้างสรรค์ควรเลือก Davinci หรือ Curie เท่านั้น ในขณะที่งานเขียนของ Babbage นั้นมีคุณภาพค่อนข้างต่ำ</li></ul><p> </p><p>คนที่อยากลองใช้งานในมุมธุรกิจ หรือต้องการพัฒนาร่วมกับ Applications ที่มีอยู่แล้วสามารถกรอกรายละเอียดใน waitlist ที่นี่ครับ</p><p><a href="https://share.hsforms.com/1Lfc7WtPLRk2ppXhPjcYY-A4sk30">https://share.hsforms.com/1Lfc7WtPLRk2ppXhPjcYY-A4sk30</a></p><p>สำหรับผู้ที่ต้องการใช้ในงานวิจัยกรอกฟอร์มนี้ครับ</p><p><a href="https://share.hsforms.com/1b-BEAq_qQpKcfFGKwwuhxA4sk30">https://share.hsforms.com/1b-BEAq_qQpKcfFGKwwuhxA4sk30</a></p>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-450</guid>
                    </item>
				                    <item>
                        <title>RE: ว่าด้วยเรื่อง GPT2 &amp; 3 และ OpenAI API (Update GPT3 เมษายน 2021 และ GPT2 Workshop เมษายน 2020)</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-446</link>
                        <pubDate>Wed, 07 Apr 2021 07:54:38 +0000</pubDate>
                        <description><![CDATA[มาดู 5 applications เจ๋งๆ จาก GPT-3ThaiKeras and Kaggle - 14 มีนาคม 2021 พวกเราอาจเคยได้ยินคำล่ำลือถึงความฉลาดของ GPT-3 ผลงานจากทีม OpenAI ที่สามารถสื่อสารเรื่องราวทางภาษาได้ใกล้เคียงกับมนุษ...]]></description>
                        <content:encoded><![CDATA[<p><span style="text-decoration: underline;font-size: 24pt"><strong>มาดู 5 applications เจ๋งๆ จาก GPT-3</strong></span></p><p>ThaiKeras and Kaggle - 14 มีนาคม 2021</p><p> </p><p>พวกเราอาจเคยได้ยินคำล่ำลือถึงความฉลาดของ GPT-3 ผลงานจากทีม OpenAI ที่สามารถสื่อสารเรื่องราวทางภาษาได้ใกล้เคียงกับมนุษย์มาก </p><p>สิ่งที่น่าสนใจก็คือ GPT-3 สามารถเอาไปใช้ทำอะไรได้บ้างกันนะ … ปัจจุบันแม้ GPT-3 จะยังไม่ถูก open source แต่ทาง OpenAI ก็ได้เปิดโอกาสให้ผู้พัฒนา software หลายกลุ่มได้นำ GPT-3 ไปสร้างสรรค์ applications ใหม่ๆ มากมาย</p><p>ปัจจุบันมีผู้รวบรวม Applications ต่างๆ ของ GPT-3 ไว้ที่ <a href="http://www.gpt3demo.com">www.gpt3demo.com</a> ซึ่งแบ่งเป็นหมวดหมู่ให้เยี่ยมชมไว้มากมาย เราลองมาดูสัก 5 ตัวอย่างเจ๋งๆ กันครับ</p><p> </p><p><span style="text-decoration: underline"><strong>Game - AI Dungeon (Dragon Mode)</strong></span></p><p> </p><p><img src="https://i.ibb.co/qdYKMkk/GPT3-AIDungeon.jpg" /></p><p> </p><p>AI Dungeon - <a href="https://play.aidungeon.io/">https://play.aidungeon.io/</a> คือ เกมส์ Text Adventure ที่จะเล่าเรื่อง story ต่างๆ ให้เราซึ่งเป็นตัวละครหนึ่งได้ฟัง และให้เราตัดสินใจว่าจะทำอย่างไรในเหตุการณ์นั้นๆ โดยการพิมพ์ข้อความเข้าไป</p><p>โดย AI ซึ่งเมื่อทำความเข้าใจทางเลือกของเราแล้ว (GPT-2 สำหรับผู้เล่นธรรมดาและ GPT-3 สำหรับผู้เล่น premium) จะนำการตัดสินใจของเราไปดำเนินเรื่อง และสร้างเหตุการณ์ต่างๆ ให้เราได้ตัดสินใจเรื่อยๆ อย่างสนุกสนาน</p><p>โดยเนื้อเรื่องจะเป็นโลกแฟนตาซีสมมติหรือโลกความเป็นจริงในประเทศอะไรก็ได้</p><p>AI Dungeon น่าจะเป็น รายแรกๆ ที่นำ GPT-3 มาใช้และเปิดให้ผู้เล่น premium (ประเภท Gold เดือนละ 10 เหรียญ หรือ300 บาท)</p><p>วิธีการเล่นหรือคุยกับ GPT-3 เมื่อสมัคร premium แล้วทำได้ง่ายๆ เพียงแค่เลือกไปยังโหมด "Dragon" เราสามารถเล่นกับ AI Dungeon ได้เสมือนกับเราได้มีส่วนแต่งนิยายแฟนตาซีเจ๋งๆ ที่ไม่มีวันจบ</p><p>เรายังสามารถทดลองคุยกับ GPT-3 ในลักษณะ ChatBot ได้บน AI Dungeon อีกด้วย</p><p> </p><p><span style="text-decoration: underline"><strong>ChatBot - Emerson</strong></span></p><p><br />https://i.ibb.co/m4KJBkS/GPT3-emerson.jpg</p><p> </p><p>ถ้าเราอยากคุยกับ GPT-3 ในรูป Chatbot ใน FB messenger หรือ Telegram เราสามารถลองได้ฟรี ที่ emerson.ai</p><p>โดยผมได้ทดลองคุยให้ Emerson แนะนำสถานที่ท่องเที่ยวในประเทศไทยของเรา เจ้า bot ตัวนี้แนะนำได้น่าสนใจมากๆ ว่าถ้าชอบภูเขาให้ไปเขาใหญ่ ชอบทะเลให้ไปเสม็ด แต่ถ้าชอบชิลๆ ให้ไปเชียงใหม่  หรือถ้าอยากดูวัฒนธรรมโบราณบ้านเราให้ไปสุโขทัย</p><p>จากนั้นผมลองเจาะลึกให้แนะนำเกาะที่น่าสนใจต่างๆ ในบ้านเรา Emerson ก็แนะนำเกาะเสม็ด เกาะช้าง ภูเก็ด เกาะลันตา เกาะกระดาน เกาะหมาก เกาะกูด พร้อมทั้งบอกเสร็จสรรพว่าที่ไหนคนเยอะ ที่ไหนเงียบ ซึ่งค่อนข้างใกล้เคียงกับความจริงมากๆ ลองถามต่อว่ารู้จักหลีเป้ะไหม ก็ตอบได้</p><p>อย่างไรก็ดีถ้าเราเจาะลึกมากๆ เช่นให้แนะนำที่พักในโคราช เจ้า Emerson ก็โชว์ความไม่สมบูรณ์แบบออกมา โดยแนะนำให้ไปพักที่โรงแรมสนามบินโคราช (ซึ่งไม่มี)  </p><p>ถือได้ว่าเป็น Bot ที่เก่งมากๆๆ และคุยสนุกจริงๆ ครับ อย่างไรก็ดีการคุยฟรีจะคุยได้ไม่กี่ประโยคใน 1 วันเท่านั้น ถ้าอยากคุยต่อต้อง subscribe premium ซึ่งมีราคาราวๆ 10 เหรียญต่อเดือนครับ</p><p> </p><p><span style="text-decoration: underline"><strong>Virtual Reality + AI - ModBox</strong></span></p><p><img src="https://i.ibb.co/Jpr6F39/GPT3-modbox.jpg" /></p><p>ModBox ได้ทดลองทำ prototype การนำ GPT-3 มาผนวกกับ Virtual Reality Game โดยให้ characters อื่นๆ ทุกตัวนอกจากผู้เล่นใน VR ตอบโต้กับผู้เล่นด้วย GPT-3</p><p>เราสามารถดูตัวอย่าง VR ได้ที่ (ปัจจุบันยังไม่มีให้เล่นจริง เป็นเพียง prototype เท่านั้น)</p><p><a href="https://youtu.be/jH-6-ZIgmKY">https://youtu.be/jH-6-ZIgmKY</a></p><p> </p><p>แค่ prototype ก็ดูตืนตาตื่นใจมากครับ</p><p>จากตัวอย่างเดาว่านำอาชีพ สถานที่ การแต่งตัว มุมมองของตัวละครมาเปลี่ยนเป็นข้อมูลให้ GPT-3 ประกอบกับประโยคพูดคุยของผู้เล่นในการสร้างบทสนทนา</p><p>.</p><p> </p><p><span style="text-decoration: underline"><strong>Digital Marketing - Pencil</strong></span></p><p>ที่ <a href="https://www.trypencil.com/">https://www.trypencil.com/</a> อ้างว่าสามารถสร้างโฆษณา Facebook Ads ได้อย่างอัตโนมัติ! ไม่ว่าจะเป็น ads แบบรูปภาพหรือ ads แบบวิดิโอ โดยรวมพลัง Computer Vision ในการทำความเข้าใจรูปภาพ และ GPT-3 ในการสร้างคำบรรยาย</p><p>นอกจากนี้ตัว software ยังประกอบไปด้วยโมเดล predict ประสิทธิภาพของโฆษณาที่ถูกสร้างมาอัตโนมัติด้วย เช่น CTA CTR metrics ใน Facebook Analytics</p><p>การสมัคร premium เพื่อสร้างโฆษณานั้นราคาค่อนข้างแพงมากถึง 750$ (23,000 บาท) ต่อเดือน  ทางทีมงาน ThaiKeras เลยมิบังอาจลองใช้งานครับ :D</p><p>อย่างไรก็ดีดูตัวอย่างโฆษณาที่สร้างโดย AI ได้ที่</p><p><a href="https://www.youtube.com/playlist?list=PLPkUfyZOOFdn44f-8BBy_wJvFPjWWQ9MH">https://www.youtube.com/playlist?list=PLPkUfyZOOFdn44f-8BBy_wJvFPjWWQ9MH</a></p><p> </p><p> </p><p> </p><p><span style="text-decoration: underline"><strong>Content Generation - ContentBot</strong></span></p><p>ที่ <a href="https://contentbot.ai/">https://contentbot.ai/</a> ได้พัฒนา GPT-3 ให้สามารถสร้างบทความได้หลายรูปแบบไม่ว่าจะเป็นการเขียน Blog เขียนข่าว หรือโฆษณา</p><p>โดยเราเพียงกำหนดหัวข้อว่าต้องการให้เขียนเกี่ยวกับเรื่องอะไร จากนั้น contentbot จะ generate content ที่น่าสนใจที่เกี่ยวข้องกับหัวข้อนั้นให้เราทันที</p><p>Contentbot.ai นั้นให้เราทดลองสร้าง free account ได้และจะได้ 20 credits โดยเราทดลองสร้าง contents ได้ เช่น</p><p>ถ้าเรากำหนดไปว่าอยากสร้างโฆษณา dunkin donuts ตัว contentbot ก็จะสร้างคำบรรยายให้ เช่น</p><p>Dunkin' Donuts is famous for their delicious products. But in our store you can choose your most favorite flavors!</p><p>หรือถ้ากำหนดหัวข้อ blogs ตัว contentbot ก็จะสร้าง intro ให้ 5 แบบในหัวข้อที่กำหนด (ดูตัวอย่างในรูปแนบสำหรับหัวข้อ การทำ marketing สำหรับบริษัท startups) เป็นต้น</p><p> </p><p>https://i.ibb.co/dbgrdxm/GPT3-contentbot.jpg</p><p><br />https://i.ibb.co/16rX506/GPT3-Contentbot2.jpg</p><p>.</p><p> </p><p><span style="text-decoration: underline"><strong>Applications อื่นๆ</strong></span></p><p>นอกจาก 5 ตัวอย่าง applications ที่เล่ามายังมีตัวอย่างอีกมากมายใน gpt3demo.com เพื่อนๆ ลองเข้าไปเล่นกันดูได้ครับ</p>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-446</guid>
                    </item>
				                    <item>
                        <title>RE: GPT-2 ของ OpenAI สามารถแต่งเรื่องราวได้ราวกับมนุษย์แล้วจ้า (Update Workshop เมษายน 2020)</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-365</link>
                        <pubDate>Sat, 25 Jul 2020 10:22:07 +0000</pubDate>
                        <description><![CDATA[UPDATE : GPT-3 คุยกับมนุษย์ได้ดีที่สุดตั้งแต่เคยเห็นม]]></description>
                        <content:encoded><![CDATA[<p>UPDATE : GPT-3 คุยกับมนุษย์ได้ดีที่สุดตั้งแต่เคยเห็นมา<br /><br /><a href="https://medium.com/@kirkouimet/turing-test-2669daffae38">https://medium.com/@kirkouimet/turing-test-2669daffae38</a></p>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/paged/2/#post-365</guid>
                    </item>
				                    <item>
                        <title>RE: GPT-2 ของ OpenAI สามารถแต่งเรื่องราวได้ราวกับมนุษย์แล้วจ้า (Update Workshop เมษายน 2020)</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/#post-295</link>
                        <pubDate>Sun, 26 Apr 2020 22:58:10 +0000</pubDate>
                        <description><![CDATA[ตัวอย่างใช้ GPT2 แต่งเพลง และทำนอง สไตล์ folk musi]]></description>
                        <content:encoded><![CDATA[<p>ตัวอย่างใช้ GPT2 แต่งเพลง และทำนอง สไตล์ folk music</p><p>https://www.gwern.net/GPT-2-music</p>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/#post-295</guid>
                    </item>
				                    <item>
                        <title>RE: GPT-2 ของ OpenAI สามารถแต่งเรื่องราวได้ราวกับมนุษย์แล้วจ้า</title>
                        <link>https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/#post-289</link>
                        <pubDate>Wed, 22 Apr 2020 12:55:33 +0000</pubDate>
                        <description><![CDATA[ThaiKeras Workshop : ปลดปล่อยจินตนาการไร้ขีดจำกัดด้วย HuggingFace GPT-2!!ThaiKeras (22 April 2020)&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;...]]></description>
                        <content:encoded><![CDATA[<p><span style="text-decoration: underline"><strong><span style="font-size: 18pt">ThaiKeras Workshop : ปลดปล่อยจินตนาการไร้ขีดจำกัดด้วย HuggingFace GPT-2!!</span></strong></span><br />ThaiKeras (22 April 2020)</p><p>&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br />&gt; นักวิทยาศาสตร์ได้ค้นพบแบคทีเรียชนิดใหม่ที่สามารถอยู่ได้โดยปราศจากออกซิเจน แบคทีเรียเหล่านี้มีชื่อว่า Bacteroides lactis พบได้ในทะเลสาบแม่น้ำและหนองน้ำทั่วโลก นักวิจัยเชื่อว่า B. lactis อาจมีอยู่ในโลกเป็นเวลา 2 ล้านปี พวกเขาเชื่อว่านี่เป็นรูปแบบสิ่งมีชีวิตที่เก่าแก่ที่สุดที่รู้จักบนโลก แม้ว่าสิ่งมีชีวิตใหม่ไม่ได้ผลิตซ้ำหรือวิวัฒนาการในมหาสมุทรเหมือนกับจุลินทรีย์อื่น ๆ แต่มันก็เป็นบรรพบุรุษโดยตรงของจุลินทรีย์อื่น ๆ ทั้งหมดที่อาศัยอยู่ในโลก</p><p>&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br />&gt; สวัสดีชื่อของฉันคือเจมส์และฉันจะทำหน้าที่เป็นหมอดูแลคุณ เพื่อสุขภาพและความปลอดภัยคุณต้องถอดแจ็คเก็ตและหมวกออก มีปืนอยู่ข้างแขนซ้ายของคุณ ดูอย่างใกล้ชิดและคุณจะเห็นว่ามันถูกโหลด มันเป็นเรมิงตัน 641 นั่นคือทั้งหมดที่ ไม่มีใครได้รับอนุญาตให้มีปืนหรือพกอาวุธเลย ถ้าคุณทำคุณจะถูกยิงทันที อย่าแตะต้องปืน<br />&gt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;</p><p>สวัสดีครับ วันนี้เราเปิดบทความกันด้วยนิยายซึ่งอาจจะดูแปลกประหลาดไปสักหน่อย แต่นิยายเหล่านี้ถูกแต่งแบบสุ่มๆ โดยโมเดล Deep Learning ที่ชื่อว่า GPT-2 !!</p><p>วันนี้ ขอต้อนรับเข้าสู่ ThaiKeras Workshop — GPT-2 Playground ที่ที่เราจะปลดปล่อยจินตนาการ และแต่งเนื้อเรื่องนิยายหรือข่าวต่างๆ ในภาษาไทยด้วยพลังของ GPT-2 และ Google Translate ครับ :D :D</p><p>Workshop สามารถทดลองได้ทันทีบน Kaggle โดยไม่มีค่าใช้จ่าย<br />https://bit.ly/thaikeras-kaggle-gpt2thai<br />ถ้าใครยังไม่คุ้นเคยกับ Kaggel ทำความรู้จักได้ที่นี่ครับ<br />http://bit.ly/thaikeras-kaggle-setup</p><p>อย่างไรก็ดีก่อนจะเริ่มเรามาทำความรู้จักกับ GPT-2 และ HuggingFace กันก่อนดีกว่า</p><p> </p><p><span style="text-decoration: underline"><strong>ว่าด้วย GPT2</strong></span></p><p>ในช่วงปีที่ผ่านมา 1 ในข่าวบันลือโลกของวงการ AI และ DeepLearning ก็คือ โมเดลที่ชื่อ GPT-2 ของทีม OpenAI ที่สามารถแต่งประโยคได้ราวกับมนุษย์ (ในแง่ของไวยากรณ์) บนเรื่อง "อะไรก็ได้" ไม่ว่าจะเป็นแนวนิยายวิทยาศาสตร์ นิยายโรแมนติก นิยายสยองขวัญ สารานุกรมแบบ Wikipedia ข่าวบนสื่อต่างๆ ฯลฯ เนื่องจาก GPT-2 นั้นถูกฝึกสอนบน texts ระดับมหาศาลบน internet ชนิดที่มนุษย์ใช้เวลาอ่านทั้งชีวิตก็ไม่จบไม่สิ้น แฟนพันธุ์แท้ของวงการ AI นี้ไม่มีใครไม่รู้จัก GPT-2 แน่นอน</p><p>อัน GPT-2 นั้นเป็นหนึ่งในโมเดลของตระกูล Transformers ที่เก่งเรื่อง "สร้างเนื้อเรื่อง" ส่วนโมเดลในตระกูล Transformer อื่นๆ ที่ดังระดับโลก อาทิเช่น BERT, ROBERTA, BART, T5 นั้นต่างก็เก่งกาจด้านภาษาอื่นๆ แตกต่างกันออกไป เช่น งานตีความหมายของประโยค งานย่อความ งานแปลภาษา เป็นต้น อย่างไรก็ดีใน Workshop นี้เราจะมาเล่น GPT-2 กันครับ</p><p>การทำงานของ GPT-2 ในหลักการนั้นง่ายมากครับ เราเพียงใส่ประโยคเริ่มต้นอะไรไปก็ได้ แล้วเจ้า GPT-2 มันก็จะไปแต่งประโยคต่อขึ้นมาเองอย่างน่ามหัศจรรย์!!! ตัวอย่างเช่น ในตัวอย่างแบคทีเรียข้างต้น เราเพียงใส่ประโยคเริ่มต้นว่า "นักวิทยาศาสตร์ได้ค้นพบแบคทีเรียชนิดใหม่ที่สามารถอยู่ได้โดยปราศจากออกซิเจน" ส่วนที่เหลือเจ้า GPT-2 ก็จะเป็นผู้จัดการจินตนการต่อเองครับ และที่เจ๋งสุดๆ ก็คือเราสามารถให้มันแต่งเนื้อเรื่องเป็นร้อยแบบที่แตกต่างกันจากประโยคเริ่มต้นประโยคเดียวของเราก็ยังได้ แบบง่ายๆ !! เช่น เรื่องข้างล่างนี้เป็นอีกเวอร์ชั่น จากเรื่องข้างบน</p><p>&gt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;<br />&gt; นักวิทยาศาสตร์ได้ค้นพบแบคทีเรียชนิดใหม่ที่สามารถอยู่ได้โดยปราศจากออกซิเจน จุลินทรีย์ที่ไม่ได้อยู่ในมหาสมุทรเหล่านี้มีชื่อเสียงในด้านความสามารถในการอยู่รอดในสภาวะที่รุนแรงเช่นช่องระบายอากาศใต้ทะเลลึกและอุณหภูมิสูง<br />&gt; ทีมนักวิจัยนำโดยดร. Danyel Wiercinski แห่งมหาวิทยาลัยฮาร์วาร์ดได้ค้นพบแบคทีเรียเหล่านี้ในตัวอย่างจากพื้นมหาสมุทรนอกชายฝั่งของออสเตรเลีย ในการวิจัยที่ตีพิมพ์ใน PNAS เมื่อสัปดาห์ที่แล้วทีมได้ค้นพบสายพันธุ์ชื่อ Oligophaga melan<br />&gt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;</p><p>สังเกตความเจ๋งที่ว่ามันสามารถตั้งชื่อสายพันธุ์แบคทีเรีย ชื่อนักวิทยาศาสตร์ รวมทั้งชื่อวารสารวิชาการได้อย่างแนบเนียนสุดๆ อีกด้วย GPT-2 ยังสามารถแต่งเนื้อเรื่องอื่นๆ อีกมากมายที่เราสามารถอ่านกันได้เพลิดเพลินใจไปเลย!!</p><p> </p><p><span style="text-decoration: underline"><strong>HugggingFace ฮีโร่ผู้ทลายกำแพงด้านภาษาของ Deep NLP</strong></span></p><p>ถึงแม้ตอนแรกจะมีข้อถกเถียงกันมากมายว่าการปลดปล่อย GPT-2 นั้นจะเป็นอันตรายหรือไม่เพราะคนสามารถนำไปช่วยสร้าง Fake News ต่างๆ ได้ อย่างไรก็ดีหลังจากทีม OpenAI ได้ศึกษาเรื่องข้อดีข้อเสียร่วมกับทีม AI อื่นๆ อีกหลายทีม ว่าข้อดีนั้นมีมากกว่าข้อเสีย ทีม OpenAI ก็เลยตัดสินใจเผยแพร่โมเดล GPT-2 ให้คนทั่วไปใช้ในที่สุด</p><p>โดย GPT-2 นั้นได้ถูกเผยแพร่มาสักพักแล้ว โดยมีหลายขนาดตั้งแต่ GPT-2 จิ๋ว กลาง ใหญ่ จนถึง GPT-2 "ยักษ์" ที่เก่งกาจขึ้นเรื่อยๆ แต่ก็ทำงานช้าลงเรื่อยๆ เช่นกัน</p><p>อย่างไรก็ดี โค้ดของทีม OpenAI นั้นค่อนข้างใช้งานยาก และทีมงาน ThaiKeras เราเองก็หาโค้ด version Keras ไม่ได้สักที เราเลยไม่ได้มีโอกาสลองเล่นอะไรมากนัก จนกระทั่งมีทีม AI ฮีโร่ของโลกที่ชื่อว่า ***HuggingFace*** ออกมาทำ API Opensource สำหรับ transformer ทั้งหมด (ไม่ใช่แค่ GPT-2) ทั้งในเวอร์ชั่น Tensorflow+Keras และ Pytorch ซึ่งใช้งานได้สะดวกและสุดยอดมากๆๆๆๆ</p><p>ด้วยพลังของ HuggingFace นั้น เราสามารถเรียกใช้ Transformer ต่างๆ กันแบบง่ายเหลือเชื่อ เขียนโปรแกรมสิบกว่าบรรทัดเท่านั้น :D และยังสามารถเซพโหลดข้อมูลจาก Pytorch สลับไปมากับ Keras ได้อีกด้วยทำให้ทำลายกำแพงความแตกต่างทางภาษาของวงการ DeepNLP ไปโดยสิ้นเชิง</p><p>นอกจากนี้การ Generate texts ให้เป็นธรรมชาตินั้นยังยากเทคนิกมาตรฐานเช่น Greedy หรือ Beam Search นั้นพบว่าไม่เป็นธรรมชาติและมักให้ประโยคซ้ำๆ มีงานวิจัยใหม่ๆ ออกมามากมายในช่วงปี 2019 และ Team HuggingFace นี้ยัง implement 2 วิธีสร้าง texts ที่ได้รับการยอมรับที่สุดในปัจจุบัน (Top-K &amp; Top-P sampling) ให้เราใช้เพียงกระดิกนิ้ว ซึ่งเพื่อนๆ จะได้เรียนรู้วิธีใน Workshop นี้ด้วยครับ</p><p>จึงต้องขอกราบขอบพระคุณทีม HuggingFace https://huggingface.co/ งามๆ มา ณ ที่นี้ด้วยครับ</p><p> </p><p><span style="text-decoration: underline"><strong>Google Translation Python Library</strong></span><br />ท้ายที่สุดขอพูดถึง library จิ๋วแต่แจ๋ว https://github.com/ssut/py-googletrans ซึ่งสามารถทำให้เราใช้ google translate ได้ง่ายๆ เพียงหนึ่งบรรทัดเท่านั้น</p><p>ใน Workshop นี้เราจะไม่ได้ใช้ GPT-2 ที่ถูกสอนบน "ภาษาไทย" โดยตรง (เพราะต้องใช้ทรัพยากรสอนที่มหาศาลมาก) แต่เราจะ "ลักไก่" ด้วยการ "แปลไป แปลกลับ" แทน นั้นคือ เราจะแปล "ประโยคเริ่มต้นภาษาไทย" เป็นภาษาอังกฤษแล้วให้ GPT-2 ไปสร้างเนื้อเรื่องต่อ เมื่อแต่งเรื่องเสร็จแล้ว เราก็จะ "แปลกลับ" เป็นภาษาไทยอีกรอบกัน :D</p><p>ถ้าพร้อมแล้วก็เริ่มกันเลยที่ลิงก์นี้ครับ<br />https://bit.ly/thaikeras-kaggle-gpt2thai</p>]]></content:encoded>
						                            <category domain="https://thaikeras.com/community/main-forum/">คุยกันภาษา AI</category>                        <dc:creator>The Neural Engineer</dc:creator>
                        <guid isPermaLink="true">https://thaikeras.com/community/main-forum/gpt-2-%e0%b8%82%e0%b8%ad%e0%b8%87-openai-%e0%b8%aa%e0%b8%b2%e0%b8%a1%e0%b8%b2%e0%b8%a3%e0%b8%96%e0%b9%81%e0%b8%95%e0%b9%88%e0%b8%87%e0%b9%80%e0%b8%a3%e0%b8%b7%e0%b9%88%e0%b8%ad%e0%b8%87%e0%b8%a3/#post-289</guid>
                    </item>
							        </channel>
        </rss>
		