សម្រាប់ BMS, BUS, ឧស្សាហកម្ម, ឧបករណ៍ខ្សែ។

នៅពេលដែលពិធីបុណ្យនិទាឃរដូវខិតជិតមកដល់ ភាពរំភើបជុំវិញ DeepSeek នៅតែខ្លាំង។ ថ្ងៃឈប់សម្រាកនាពេលថ្មីៗនេះបានបង្ហាញពីអារម្មណ៍ប្រកួតប្រជែងដ៏សំខាន់នៅក្នុងឧស្សាហកម្មបច្ចេកវិទ្យា ដោយមនុស្សជាច្រើនបានពិភាក្សា និងវិភាគ "ត្រីឆ្មា" នេះ។ Silicon Valley កំពុងជួបប្រទះវិបត្តិដែលមិនធ្លាប់មានពីមុនមក៖ អ្នកតស៊ូមតិនៃប្រភពបើកចំហកំពុងបញ្ចេញមតិរបស់ពួកគេម្តងទៀត ហើយសូម្បីតែ OpenAI ក៏កំពុងវាយតម្លៃឡើងវិញថាតើយុទ្ធសាស្ត្រប្រភពបិទរបស់វាជាជម្រើសដ៏ល្អបំផុតដែរឬទេ។ គំរូថ្មីនៃការចំណាយលើការគណនាទាបបានបង្កឱ្យមានប្រតិកម្មខ្សែសង្វាក់ក្នុងចំណោមក្រុមហ៊ុនផលិតបន្ទះឈីបដូចជា Nvidia ដែលនាំឱ្យមានការខាតបង់តម្លៃទីផ្សារតែមួយថ្ងៃនៅក្នុងប្រវត្តិសាស្រ្តទីផ្សារភាគហ៊ុនអាមេរិក ខណៈដែលភ្នាក់ងាររដ្ឋាភិបាលកំពុងស៊ើបអង្កេតការអនុលោមនៃបន្ទះឈីបដែលប្រើប្រាស់ដោយ DeepSeek ។ ចំពេលមានការពិនិត្យឡើងវិញចម្រុះនៃ DeepSeek នៅក្រៅប្រទេស ក្នុងស្រុកវាកំពុងមានការរីកចម្រើនមិនធម្មតា។ បន្ទាប់ពីការបើកដំណើរការនៃម៉ូដែល R1 កម្មវិធីដែលពាក់ព័ន្ធបានឃើញការកើនឡើងនៃចរាចរណ៍ ដែលបង្ហាញថាកំណើននៅក្នុងផ្នែកកម្មវិធីនឹងជំរុញប្រព័ន្ធអេកូ AI ទាំងមូលឆ្ពោះទៅមុខ។ ទិដ្ឋភាពវិជ្ជមានគឺថា DeepSeek នឹងពង្រីកលទ្ធភាពកម្មវិធី ដោយបង្ហាញថាការពឹងផ្អែកលើ ChatGPT នឹងមិនមានតម្លៃថ្លៃដូចនៅពេលអនាគតទេ។ ការផ្លាស់ប្តូរនេះត្រូវបានឆ្លុះបញ្ចាំងនៅក្នុងសកម្មភាពថ្មីៗរបស់ OpenAI រួមទាំងការផ្តល់គំរូហេតុផលដែលហៅថា o3-mini ដល់អ្នកប្រើប្រាស់ដោយឥតគិតថ្លៃក្នុងការឆ្លើយតបទៅនឹង DeepSeek R1 ក៏ដូចជាការធ្វើឱ្យប្រសើរឡើងជាបន្តបន្ទាប់ដែលធ្វើឱ្យខ្សែសង្វាក់គំនិតនៃ o3-mini ជាសាធារណៈ។ អ្នកប្រើប្រាស់នៅក្រៅប្រទេសជាច្រើនបានសម្តែងការដឹងគុណចំពោះ DeepSeek សម្រាប់ការអភិវឌ្ឍន៍ទាំងនេះ ទោះបីជាខ្សែសង្វាក់គំនិតនេះដើរតួជាការសង្ខេបក៏ដោយ។
ជាសុទិដ្ឋិនិយម វាគឺជាភស្តុតាងដែលថា DeepSeek កំពុងបង្រួបបង្រួមអ្នកលេងក្នុងស្រុក។ ជាមួយនឹងការផ្តោតលើការកាត់បន្ថយការចំណាយលើការបណ្តុះបណ្តាល ក្រុមហ៊ុនផលិតបន្ទះសៀគ្វីខាងលើជាច្រើន អ្នកផ្តល់សេវាពពកកម្រិតមធ្យម និងការចាប់ផ្ដើមអាជីវកម្មជាច្រើនកំពុងចូលរួមយ៉ាងសកម្មជាមួយប្រព័ន្ធអេកូ ដែលបង្កើនប្រសិទ្ធភាពចំណាយសម្រាប់ការប្រើប្រាស់គំរូ DeepSeek ។ យោងតាមឯកសាររបស់ DeepSeek ការបណ្តុះបណ្តាលពេញលេញនៃម៉ូដែល V3 ត្រូវការត្រឹមតែ 2.788 លាន H800 GPU ម៉ោងប៉ុណ្ណោះ ហើយដំណើរការបណ្តុះបណ្តាលមានស្ថេរភាពខ្ពស់។ ស្ថាបត្យកម្ម MoE (Mixture of Experts) គឺមានសារៈសំខាន់សម្រាប់កាត់បន្ថយការចំណាយមុនការបណ្តុះបណ្តាលដោយកត្តាដប់បើប្រៀបធៀបទៅនឹង Llama 3 ដែលមានប៉ារ៉ាម៉ែត្រ 405 ពាន់លាន។ បច្ចុប្បន្ននេះ V3 គឺជាម៉ូដែលដំបូងគេដែលទទួលស្គាល់ជាសាធារណៈដែលបង្ហាញពីភាពខុសប្លែកគ្នាខ្ពស់នៅក្នុង MoE ។ លើសពីនេះ MLA (Multi Layer Attention) ធ្វើការរួមគ្នា ជាពិសេសនៅក្នុងទិដ្ឋភាពហេតុផល។ អ្នកស្រាវជ្រាវម្នាក់មកពីក្រុមហ៊ុន Chuanjing Technology បានកត់សម្គាល់នៅក្នុងការវិភាគមួយសម្រាប់ AI Technology Review ថា " MoE កាន់តែខ្វែងគំនិត ដែលទំហំបាច់ធំជាងដែលត្រូវការក្នុងអំឡុងការវែកញែកដើម្បីប្រើប្រាស់ថាមពលកុំព្យូទ័រឱ្យបានពេញលេញ ដោយទំហំរបស់ KVCache គឺជាកត្តាកំណត់សំខាន់។ MLA កាត់បន្ថយទំហំ KVCache យ៉ាងខ្លាំង" ។ សរុបមក ភាពជោគជ័យរបស់ DeepSeek ស្ថិតនៅក្នុងការរួមបញ្ចូលគ្នានៃបច្ចេកវិទ្យាផ្សេងៗ មិនមែនតែមួយមុខនោះទេ។ អ្នកខាងក្នុងឧស្សាហកម្មសរសើរពីសមត្ថភាពវិស្វកម្មរបស់ក្រុម DeepSeek ដោយកត់សម្គាល់ពីភាពល្អឥតខ្ចោះរបស់ពួកគេក្នុងការបណ្តុះបណ្តាលស្របគ្នា និងការបង្កើនប្រសិទ្ធភាពប្រតិបត្តិករ ដោយសម្រេចបាននូវលទ្ធផលដ៏ល្អឥតខ្ចោះដោយការកែលម្អរាល់ព័ត៌មានលម្អិត។ វិធីសាស្រ្តប្រភពបើកចំហរបស់ DeepSeek ជំរុញការអភិវឌ្ឍន៍រួមនៃម៉ូដែលធំៗ ហើយវាត្រូវបានគេរំពឹងថា ប្រសិនបើម៉ូដែលស្រដៀងគ្នានេះពង្រីកទៅជារូបភាព វីដេអូ និងច្រើនទៀត វានឹងជំរុញតម្រូវការយ៉ាងខ្លាំងនៅទូទាំងឧស្សាហកម្មនេះ។
ឱកាសសម្រាប់សេវាហេតុផលភាគីទីបី
ទិន្នន័យបង្ហាញថាចាប់តាំងពីការចេញផ្សាយរបស់ខ្លួន DeepSeek ទទួលបានអ្នកប្រើប្រាស់សកម្មប្រចាំថ្ងៃ (DAU) ចំនួន 22.15 លាននាក់ក្នុងរយៈពេលត្រឹមតែ 21 ថ្ងៃ ដោយសម្រេចបាន 41.6% នៃមូលដ្ឋានអ្នកប្រើប្រាស់របស់ ChatGPT និងលើសពី 16.95 លាននាក់នៃអ្នកប្រើប្រាស់សកម្មប្រចាំថ្ងៃរបស់ Doubao ដូច្នេះក្លាយជាកម្មវិធីដែលរីកលូតលាស់លឿនបំផុតនៅទូទាំងពិភពលោក ដោយឈរលើកំពូលតារាង Apple7 App Store ក្នុង 15 ប្រទេស/regions។ ទោះបីជាយ៉ាងណាក៏ដោយ ខណៈពេលដែលអ្នកប្រើប្រាស់បានប្រមូលផ្តុំគ្នាយ៉ាងគគ្រឹកគគ្រេង ពួកហេគឃ័រតាមអ៊ីនធឺណិតបាននិងកំពុងវាយប្រហារយ៉ាងឥតឈប់ឈរទៅលើកម្មវិធី DeepSeek ដែលបង្កឱ្យមានភាពតានតឹងយ៉ាងសំខាន់នៅលើម៉ាស៊ីនមេរបស់វា។ អ្នកវិភាគឧស្សាហកម្មជឿថានេះមួយផ្នែកដោយសារតែ DeepSeek ដាក់ពង្រាយកាតសម្រាប់ការបណ្តុះបណ្តាលខណៈពេលដែលខ្វះថាមពលគណនាគ្រប់គ្រាន់សម្រាប់ការវែកញែក។ អ្នកខាងក្នុងឧស្សាហកម្មបានប្រាប់ AI Technology Review ថា "បញ្ហាម៉ាស៊ីនមេញឹកញាប់អាចដោះស្រាយបានយ៉ាងងាយស្រួលដោយការគិតថ្លៃ ឬការផ្តល់ហិរញ្ញប្បទានដើម្បីទិញម៉ាស៊ីនបន្ថែម ទីបំផុតវាអាស្រ័យលើការសម្រេចចិត្តរបស់ DeepSeek"។ នេះបង្ហាញពីការដោះដូរក្នុងការផ្តោតលើបច្ចេកវិទ្យាធៀបនឹងផលិតភាព។ DeepSeek បានពឹងផ្អែកភាគច្រើនលើបរិមាណបរិមាណសម្រាប់ការចិញ្ចឹមខ្លួនឯង ដោយបានទទួលមូលនិធិពីខាងក្រៅតិចតួច ដែលបណ្តាលឱ្យមានសម្ពាធលំហូរសាច់ប្រាក់ទាប និងបរិយាកាសបច្ចេកវិទ្យាដ៏បរិសុទ្ធ។ បច្ចុប្បន្ននេះ ដោយសារបញ្ហាដែលបានរៀបរាប់ខាងលើ អ្នកប្រើប្រាស់មួយចំនួនកំពុងជំរុញឱ្យ DeepSeek នៅលើប្រព័ន្ធផ្សព្វផ្សាយសង្គមបង្កើនកម្រិតនៃការប្រើប្រាស់ ឬណែនាំមុខងារបង់ប្រាក់ដើម្បីបង្កើនភាពងាយស្រួលរបស់អ្នកប្រើប្រាស់។ លើសពីនេះទៀត អ្នកអភិវឌ្ឍន៍បានចាប់ផ្តើមប្រើប្រាស់ API ផ្លូវការ ឬ APIs ភាគីទីបីសម្រាប់ការបង្កើនប្រសិទ្ធភាព។ ទោះជាយ៉ាងណាក៏ដោយ វេទិកាបើកចំហរបស់ DeepSeek ថ្មីៗនេះបានប្រកាសថា "ធនធានម៉ាស៊ីនមេបច្ចុប្បន្នខ្វះខាត ហើយការគិតថ្លៃសេវា API ត្រូវបានផ្អាក។"
នេះពិតជាបើកឱកាសកាន់តែច្រើនសម្រាប់អ្នកលក់ភាគីទីបីនៅក្នុងវិស័យហេដ្ឋារចនាសម្ព័ន្ធ AI ។ ថ្មីៗនេះ ក្រុមហ៊ុនយក្សពពកក្នុងស្រុក និងអន្តរជាតិជាច្រើនបានបើកដំណើរការ APIs គំរូរបស់ DeepSeek—ក្រុមហ៊ុនយក្សនៅក្រៅប្រទេស Microsoft និង Amazon គឺជាក្រុមហ៊ុនដំបូងគេដែលបានចូលរួមនៅចុងខែមករា។ អ្នកដឹកនាំក្នុងស្រុក Huawei Cloud បានធ្វើការផ្លាស់ប្តូរលើកដំបូង ដោយបញ្ចេញសេវាកម្មហេតុផល DeepSeek R1 និង V3 ដោយសហការជាមួយ Flow ដែលមានមូលដ្ឋាននៅ Silicon កាលពីថ្ងៃទី 1 ខែកុម្ភៈ។ របាយការណ៍ពី AI Technology Review បង្ហាញថា សេវាកម្មរបស់ Flow ដែលមានមូលដ្ឋានលើ Silicon បានមើលឃើញលំហូរអ្នកប្រើប្រាស់យ៉ាងមានប្រសិទ្ធភាព "គាំង" វេទិកា។ ក្រុមហ៊ុនបច្ចេកវិទ្យាធំៗទាំងបីគឺ BAT (Baidu, Alibaba, Tencent) និង ByteDance - ក៏បានចេញការផ្តល់ជូនតម្លៃទាប និងពេលវេលាកំណត់ផងដែរ ដែលចាប់ផ្តើមពីថ្ងៃទី 3 ខែកុម្ភៈ ដោយរំឮកដល់សង្រ្គាមតម្លៃអ្នកលក់ពពកកាលពីឆ្នាំមុនដែលបញ្ឆេះដោយការបើកដំណើរការគំរូ V2 របស់ DeepSeek ដែល DeepSeek ចាប់ផ្តើមត្រូវបានគេហៅថា "អ្នកកាប់តម្លៃ" ។ សកម្មភាពដ៏គួរឱ្យភ័យខ្លាចរបស់អ្នកលក់ពពកបានបន្លឺឡើងអំពីទំនាក់ទំនងដ៏រឹងមាំពីមុនរវាង Microsoft Azure និង OpenAI ដែលនៅក្នុងឆ្នាំ 2019 ក្រុមហ៊ុន Microsoft បានធ្វើការវិនិយោគចំនួន $1 ពាន់លានដុល្លារនៅក្នុង OpenAI និងទទួលបានអត្ថប្រយោជន៍បន្ទាប់ពីការបើកដំណើរការរបស់ ChatGPT ក្នុងឆ្នាំ 2023។ ទោះជាយ៉ាងណាក៏ដោយ ទំនាក់ទំនងជិតស្និទ្ធនេះបានចាប់ផ្តើមរអាក់រអួលបន្ទាប់ពី Meta open-sourced Llama ដែលអនុញ្ញាតឱ្យអ្នកលក់ម៉ូដែលធំផ្សេងទៀតប្រកួតប្រជែងជាមួយ Microsoft ។ ក្នុងករណីនេះ DeepSeek មិនត្រឹមតែបានវ៉ាដាច់ ChatGPT ទាក់ទងនឹងកំដៅផលិតផលប៉ុណ្ណោះទេ ប៉ុន្តែថែមទាំងបានណែនាំគំរូប្រភពបើកចំហបន្ទាប់ពីការចេញផ្សាយ o1 ស្រដៀងនឹងការរំភើបជុំវិញការរស់ឡើងវិញរបស់ Llama នៃ GPT-3 ។
តាមពិតទៅ អ្នកផ្តល់សេវាពពកក៏កំពុងដាក់ខ្លួនពួកគេថាជាច្រកផ្លូវចរាចរណ៍សម្រាប់កម្មវិធី AI ដែលមានន័យថាការពង្រឹងទំនាក់ទំនងកាន់តែស៊ីជម្រៅជាមួយអ្នកអភិវឌ្ឍន៍ បកប្រែទៅជាអត្ថប្រយោជន៍ជាមុន។ របាយការណ៍បង្ហាញថា Baidu Smart Cloud មានអតិថិជនជាង 15,000 នាក់ប្រើប្រាស់ម៉ូដែល DeepSeek តាមរយៈវេទិកា Qianfan នៅថ្ងៃដាក់បង្ហាញម៉ូដែល។ លើសពីនេះទៀត ក្រុមហ៊ុនតូចៗជាច្រើនកំពុងផ្តល់ដំណោះស្រាយ រួមទាំងលំហូរដែលមានមូលដ្ឋានលើ Silicon, Luchen Technology, Chuanjing Technology និងអ្នកផ្តល់សេវា AI Infra ជាច្រើនដែលបានចាប់ផ្តើមការគាំទ្រសម្រាប់ម៉ូដែល DeepSeek ។ AI Technology Review បានដឹងថា ឱកាសបង្កើនប្រសិទ្ធភាពបច្ចុប្បន្នសម្រាប់ការដាក់ពង្រាយមូលដ្ឋានីយកម្មនៃ DeepSeek មានជាចម្បងនៅក្នុងផ្នែកពីរ៖ មួយគឺការធ្វើឱ្យប្រសើរសម្រាប់លក្ខណៈវិសាលភាពនៃគំរូ MoE ដោយប្រើវិធីសាស្រ្តសមហេតុផលចម្រុះដើម្បីដាក់ពង្រាយគំរូ MoE ប៉ារ៉ាម៉ែត្រ 671 ពាន់លាននៅក្នុងមូលដ្ឋាន ខណៈពេលដែលប្រើប្រាស់ការសន្និដ្ឋានរបស់ GPU/CPU កូនកាត់។ លើសពីនេះ ការបង្កើនប្រសិទ្ធភាពនៃ MLA គឺសំខាន់ណាស់។ ទោះជាយ៉ាងណាក៏ដោយ ម៉ូដែលទាំងពីររបស់ DeepSeek នៅតែប្រឈមមុខនឹងបញ្ហាមួយចំនួនក្នុងការបង្កើនប្រសិទ្ធភាពនៃការដាក់ពង្រាយ។ អ្នកស្រាវជ្រាវមកពីក្រុមហ៊ុន Chuanjing Technology បាននិយាយថា "ដោយសារតែទំហំរបស់ម៉ូដែល និងប៉ារ៉ាម៉ែត្រជាច្រើន ការបង្កើនប្រសិទ្ធភាពគឺពិតជាស្មុគស្មាញ ជាពិសេសសម្រាប់ការដាក់ពង្រាយក្នុងស្រុក ដែលការសម្រេចបានសមតុល្យដ៏ល្អប្រសើររវាងការអនុវត្ត និងការចំណាយនឹងមានការប្រកួតប្រជែង" ។ ឧបសគ្គដ៏សំខាន់បំផុតគឺការយកឈ្នះលើដែនកំណត់សមត្ថភាពចងចាំ។ លោកបានពន្យល់បន្ថែមថា "យើងប្រកាន់យកនូវវិធីសាស្រ្តសហការគ្នាដើម្បីប្រើប្រាស់ស៊ីភីយូ និងធនធានកុំព្យូទ័រផ្សេងទៀតឱ្យបានពេញលេញ ដោយដាក់តែផ្នែកដែលមិនចែករំលែកនៃម៉ាទ្រីស MoE តិចតួចនៅលើ CPU/DRAM សម្រាប់ដំណើរការដោយប្រើប្រតិបត្តិករស៊ីភីយូដែលមានប្រសិទ្ធភាពខ្ពស់ ខណៈពេលដែលផ្នែកក្រាស់ស្ថិតនៅលើ GPU" ។ របាយការណ៍បង្ហាញថា KTransformers ក្របខ័ណ្ឌប្រភពបើកចំហរបស់ Chuanjing បញ្ចូលជាចម្បងនូវយុទ្ធសាស្ត្រ និងប្រតិបត្តិករផ្សេងៗទៅក្នុងការអនុវត្ត Transformers ដើមតាមរយៈគំរូមួយ ដោយបង្កើនល្បឿននៃការសន្និដ្ឋានយ៉ាងសំខាន់ដោយប្រើវិធីសាស្ត្រដូចជា CUDAGraph ។ DeepSeek បានបង្កើតឱកាសសម្រាប់ការចាប់ផ្តើមអាជីវកម្មទាំងនេះ ដោយសារអត្ថប្រយោជន៍នៃកំណើនកំពុងក្លាយជាជាក់ស្តែង ក្រុមហ៊ុនជាច្រើនបានរាយការណ៍ពីកំណើនអតិថិជនគួរឱ្យកត់សម្គាល់បន្ទាប់ពីការបើកដំណើរការ DeepSeek API ដោយទទួលបានការសាកសួរពីអតិថិជនមុនៗដែលកំពុងស្វែងរកការបង្កើនប្រសិទ្ធភាព។ អ្នកខាងក្នុងឧស្សាហកម្មបានកត់សម្គាល់ថា "កាលពីមុន ក្រុមអតិថិជនដែលបានបង្កើតឡើងមួយចំនួន ជារឿយៗត្រូវបានចាក់សោរទៅក្នុងសេវាកម្មស្តង់ដាររបស់ក្រុមហ៊ុនធំ ៗ ដែលត្រូវបានចងភ្ជាប់យ៉ាងតឹងរ៉ឹងដោយគុណសម្បត្តិនៃការចំណាយរបស់ពួកគេដោយសារទំហំ។ ទោះជាយ៉ាងណាក៏ដោយ បន្ទាប់ពីបញ្ចប់ការដាក់ឱ្យប្រើប្រាស់ DeepSeek-R1/V3 មុនពេលពិធីបុណ្យនិទាឃរដូវ យើងស្រាប់តែទទួលបានសំណើកិច្ចសហប្រតិបត្តិការពីអតិថិជនល្បីៗជាច្រើន ហើយថែមទាំងបានទាក់ទងអតិថិជនដែលផ្ដួចផ្ដើមគំនិត DeepSeek ពីមុនមក។ បច្ចុប្បន្ននេះ វាហាក់ដូចជា DeepSeek កំពុងធ្វើឱ្យការអនុវត្តការសន្និដ្ឋានគំរូកាន់តែមានសារៈសំខាន់ ហើយជាមួយនឹងការទទួលយកកាន់តែទូលំទូលាយនៃម៉ូដែលធំ វានឹងបន្តមានឥទ្ធិពលលើការអភិវឌ្ឍន៍នៅក្នុងឧស្សាហកម្ម AI Infra យ៉ាងខ្លាំង។ ប្រសិនបើគំរូកម្រិត DeepSeek អាចត្រូវបានដាក់ឱ្យប្រើប្រាស់ក្នុងមូលដ្ឋានក្នុងតម្លៃទាប នោះវានឹងជួយយ៉ាងខ្លាំងដល់ការខិតខំប្រឹងប្រែងបំប្លែងឌីជីថលរបស់រដ្ឋាភិបាល និងសហគ្រាស។ ទោះជាយ៉ាងណាក៏ដោយ បញ្ហាប្រឈមនៅតែបន្តកើតមាន ដោយសារអតិថិជនមួយចំនួនអាចមានការរំពឹងទុកខ្ពស់ទាក់ទងនឹងសមត្ថភាពគំរូធំ ដែលធ្វើឱ្យវាកាន់តែច្បាស់ថាតុល្យភាពនៃការអនុវត្ត និងការចំណាយក្លាយជាកត្តាសំខាន់ក្នុងការដាក់ឱ្យប្រើប្រាស់ជាក់ស្តែង។
ដើម្បីវាយតម្លៃថាតើ DeepSeek ល្អជាង ChatGPT វាចាំបាច់ណាស់ក្នុងការយល់ដឹងអំពីភាពខុសគ្នាសំខាន់ៗ ភាពខ្លាំង និងករណីប្រើប្រាស់របស់ពួកគេ។ នេះជាការប្រៀបធៀបដ៏ទូលំទូលាយ៖
លក្ខណៈ/ទិដ្ឋភាព | DeepSeek | ChatGPT |
---|---|---|
កម្មសិទ្ធិ | បង្កើតឡើងដោយក្រុមហ៊ុនចិន | បង្កើតឡើងដោយ OpenAI |
គំរូប្រភព | ប្រភពបើកចំហ | កម្មសិទ្ធិ |
ការចំណាយ | ប្រើដោយឥតគិតថ្លៃ; ជម្រើសចូលប្រើ API ថោកជាង | តម្លៃជាវ ឬបង់ក្នុងមួយការប្រើប្រាស់ |
ការប្ដូរតាមបំណង | អាចប្ដូរតាមបំណងបានខ្ពស់ ដែលអនុញ្ញាតឱ្យអ្នកប្រើអាចកែប្រែនិងបង្កើតវាបាន។ | ការប្ដូរតាមបំណងមានកំណត់ |
ការអនុវត្តក្នុងកិច្ចការជាក់លាក់ | Excel នៅក្នុងផ្នែកមួយចំនួនដូចជា ការវិភាគទិន្នន័យ និងការទាញយកព័ត៌មាន | មានភាពចម្រុះជាមួយនឹងការអនុវត្តខ្លាំងក្នុងការសរសេរប្រកបដោយភាពច្នៃប្រឌិត និងការសន្ទនា |
ការគាំទ្រភាសា | ផ្តោតខ្លាំងលើភាសា និងវប្បធម៌ចិន | ការគាំទ្រភាសាទូលំទូលាយ ប៉ុន្តែផ្តោតលើសហរដ្ឋអាមេរិក |
តម្លៃបណ្តុះបណ្តាល | ការចំណាយលើការបណ្តុះបណ្តាលទាប ធ្វើឱ្យប្រសើរសម្រាប់ប្រសិទ្ធភាព | ការចំណាយលើការបណ្តុះបណ្តាលកាន់តែខ្ពស់ ទាមទារធនធានកុំព្យូទ័រយ៉ាងច្រើន |
បំរែបំរួលនៃការឆ្លើយតប | អាចផ្តល់នូវការឆ្លើយតបខុសគ្នា ដែលអាចទទួលឥទ្ធិពលពីបរិបទភូមិសាស្ត្រនយោបាយ | ចម្លើយស្របគ្នាដោយផ្អែកលើទិន្នន័យបណ្តុះបណ្តាល |
ទស្សនិកជនគោលដៅ | ផ្តោតលើអ្នកអភិវឌ្ឍន៍ និងអ្នកស្រាវជ្រាវចង់បានភាពបត់បែន | ផ្តោតលើអ្នកប្រើប្រាស់ទូទៅដែលកំពុងស្វែងរកសមត្ថភាពសន្ទនា |
ប្រើករណី | កាន់តែមានប្រសិទ្ធភាពសម្រាប់ការបង្កើតកូដ និងកិច្ចការរហ័ស | ល្អបំផុតសម្រាប់បង្កើតអត្ថបទ ឆ្លើយសំណួរ និងចូលរួមក្នុងការសន្ទនា |
ទស្សនវិស័យសំខាន់លើ "ការរំខាន Nvidia"
នាពេលបច្ចុប្បន្ននេះ ក្រៅពីក្រុមហ៊ុន Huawei ក្រុមហ៊ុនផលិតបន្ទះឈីបក្នុងស្រុកមួយចំនួនដូចជា Moore Threads, Muxi, Biran Technology និង Tianxu Zhixin ក៏កំពុងសម្របខ្លួនទៅនឹងម៉ូដែលទាំងពីររបស់ DeepSeek ផងដែរ។ ក្រុមហ៊ុនផលិតបន្ទះឈីបបានប្រាប់ AI Technology Review ថា "រចនាសម្ព័នរបស់ DeepSeek បង្ហាញពីការច្នៃប្រឌិត ប៉ុន្តែវានៅតែជា LLM។ ការសម្របខ្លួនរបស់យើងចំពោះ DeepSeek គឺផ្តោតជាចម្បងលើកម្មវិធីហេតុផល ធ្វើឱ្យការអនុវត្តបច្ចេកទេសមានភាពត្រង់ និងរហ័ស"។ ទោះជាយ៉ាងណាក៏ដោយ វិធីសាស្រ្ត MoE តម្រូវឱ្យមានតម្រូវការខ្ពស់ទាក់ទងនឹងការផ្ទុក និងការចែកចាយ គួបផ្សំនឹងការធានាភាពត្រូវគ្នានៅពេលដាក់ពង្រាយជាមួយបន្ទះឈីបក្នុងស្រុក បង្ហាញពីបញ្ហាប្រឈមផ្នែកវិស្វកម្មជាច្រើនដែលត្រូវការដំណោះស្រាយកំឡុងពេលបន្សាំ។ "បច្ចុប្បន្ន ថាមពលកុំព្យូទ័រក្នុងស្រុកមិនត្រូវគ្នានឹង Nvidia ក្នុងការប្រើប្រាស់ និងស្ថេរភាព ដែលទាមទារឱ្យមានការចូលរួមពីរោងចក្រដើមសម្រាប់ការដំឡើងបរិស្ថានកម្មវិធី ការដោះស្រាយបញ្ហា និងការបង្កើនប្រសិទ្ធភាពប្រតិបត្តិការជាមូលដ្ឋាន" អ្នកអនុវត្តឧស្សាហកម្មបាននិយាយដោយផ្អែកលើបទពិសោធន៍ជាក់ស្តែង។ ក្នុងពេលដំណាលគ្នា "ដោយសារតែមាត្រដ្ឋានប៉ារ៉ាម៉ែត្រធំនៃ DeepSeek R1 ថាមពលកុំព្យូទ័រក្នុងស្រុកត្រូវការថ្នាំងបន្ថែមទៀតសម្រាប់ការប៉ារ៉ាឡែល។ បន្ថែមពីលើនេះ លក្ខណៈបច្ចេកទេសផ្នែករឹងក្នុងស្រុកនៅតែនៅពីក្រោយឧទាហរណ៍ Huawei 910B បច្ចុប្បន្នមិនអាចគាំទ្រការសន្និដ្ឋាន FP8 ដែលណែនាំដោយ DeepSeek ទេ។" ចំណុចលេចធ្លោមួយនៃម៉ូដែល DeepSeek V3 គឺការណែនាំអំពីក្របខ័ណ្ឌបណ្តុះបណ្តាលភាពជាក់លាក់ចម្រុះ FP8 ដែលត្រូវបានផ្ទៀងផ្ទាត់យ៉ាងមានប្រសិទ្ធភាពលើគំរូដ៏ធំបំផុត ដែលបង្ហាញពីសមិទ្ធផលដ៏សំខាន់មួយ។ កាលពីមុន អ្នកលេងធំៗដូចជា Microsoft និង Nvidia បានស្នើការងារដែលពាក់ព័ន្ធ ប៉ុន្តែការសង្ស័យនៅតែមាននៅក្នុងឧស្សាហកម្មនេះទាក់ទងនឹងលទ្ធភាព។ វាត្រូវបានគេយល់ថាបើប្រៀបធៀបទៅនឹង INT8 អត្ថប្រយោជន៍ចម្បងរបស់ FP8 គឺថាការធ្វើបរិមាណក្រោយការបណ្តុះបណ្តាលអាចសម្រេចបាននូវភាពជាក់លាក់ស្ទើរតែគ្មានការបាត់បង់ខណៈពេលដែលការបង្កើនល្បឿននៃការសន្និដ្ឋានយ៉ាងសំខាន់។ នៅពេលប្រៀបធៀបទៅនឹង FP16 FP8 អាចដឹងពីការបង្កើនល្បឿនដល់ទៅ 2 ដងនៅលើ H20 របស់ Nvidia និងការបង្កើនល្បឿនលើសពី 1.5 ដងនៅលើ H100 ។ គួរកត់សម្គាល់ថានៅពេលដែលការពិភាក្សាជុំវិញនិន្នាការនៃថាមពលកុំព្យូទ័រក្នុងស្រុកបូកនឹងម៉ូដែលក្នុងស្រុកទទួលបានសន្ទុះ ការរំពឹងទុកអំពីថាតើ Nvidia អាចត្រូវបានរំខាន និងថាតើ CUDA អាចត្រូវបានឆ្លងកាត់ឬអត់ កំពុងក្លាយជារីករាលដាលកាន់តែខ្លាំងឡើង។ ការពិតដែលមិនអាចប្រកែកបាននោះគឺថា DeepSeek ពិតជាបានធ្វើឱ្យតម្លៃទីផ្សាររបស់ Nvidia ធ្លាក់ចុះយ៉ាងខ្លាំង ប៉ុន្តែការផ្លាស់ប្តូរនេះបង្កឱ្យមានសំណួរទាក់ទងនឹងភាពត្រឹមត្រូវនៃថាមពលកុំព្យូទ័រកម្រិតខ្ពស់របស់ Nvidia ។ ការនិទានកថាដែលបានទទួលយកពីមុនទាក់ទងនឹងការប្រមូលផ្តុំគណនាដែលជំរុញដោយដើមទុនកំពុងត្រូវបានជំទាស់ ប៉ុន្តែវានៅតែពិបាកសម្រាប់ Nvidia ក្នុងការជំនួសទាំងស្រុងនៅក្នុងសេណារីយ៉ូបណ្តុះបណ្តាល។ ការវិភាគនៃការប្រើប្រាស់ស៊ីជម្រៅរបស់ DeepSeek នៃ CUDA បង្ហាញថាភាពបត់បែន - ដូចជាការប្រើប្រាស់ SM សម្រាប់ការទំនាក់ទំនង ឬរៀបចំដោយផ្ទាល់នូវកាតបណ្តាញ - មិនអាចធ្វើទៅបានសម្រាប់ GPU ធម្មតាដើម្បីផ្ទុក។ ទស្សនៈឧស្សាហកម្មសង្កត់ធ្ងន់ថាគូថរបស់ Nvidia គ្របដណ្តប់លើប្រព័ន្ធអេកូឡូស៊ី CUDA ទាំងមូលជាជាងគ្រាន់តែជា CUDA ប៉ុណ្ណោះ ហើយការណែនាំ PTX (Parallel Thread Execution) ដែល DeepSeek ប្រើគឺនៅតែជាផ្នែកមួយនៃប្រព័ន្ធអេកូឡូស៊ី CUDA ។ "ក្នុងរយៈពេលខ្លី អំណាចគណនារបស់ Nvidia មិនអាចរំលងបានទេ ជាពិសេសវាច្បាស់ណាស់ក្នុងការបណ្តុះបណ្តាល។ ទោះជាយ៉ាងណាក៏ដោយ ការដាក់ពង្រាយកាតក្នុងស្រុកសម្រាប់ការវែកញែកនឹងមានភាពងាយស្រួលជាងមុន ដូច្នេះវឌ្ឍនភាពទំនងជានឹងលឿនជាងមុន។ ការសម្របខ្លួននៃកាតក្នុងស្រុកផ្តោតជាចម្បងលើការសន្និដ្ឋាន។ គ្មាននរណាម្នាក់អាចបណ្តុះបណ្តាលគំរូនៃការអនុវត្តរបស់ DeepSeek លើកាតក្នុងស្រុកក្នុងកម្រិត AI បានទេ។" សរុបមក តាមទស្សនៈសន្និដ្ឋាន កាលៈទេសៈកំពុងលើកទឹកចិត្តសម្រាប់បន្ទះឈីបម៉ូដែលធំក្នុងស្រុក។ ឱកាសសម្រាប់ក្រុមហ៊ុនផលិតបន្ទះឈីបក្នុងស្រុកនៅក្នុងអាណាចក្រនៃការសន្និដ្ឋានគឺកាន់តែបង្ហាញឱ្យឃើញដោយសារតែតម្រូវការខ្ពស់ហួសហេតុនៃការបណ្តុះបណ្តាល ដែលរារាំងការចូល។ អ្នកវិភាគអះអាងថា ការប្រើប្រាស់ប័ណ្ណសន្និដ្ឋានក្នុងស្រុកគឺគ្រប់គ្រាន់ហើយ។ បើចាំបាច់ ការទទួលបានម៉ាស៊ីនបន្ថែមគឺអាចធ្វើទៅបាន ខណៈពេលដែលគំរូបណ្តុះបណ្តាលបង្កបញ្ហាប្រឈមពិសេស - ការគ្រប់គ្រងការកើនឡើងនៃម៉ាស៊ីនអាចក្លាយជាបន្ទុក ហើយអត្រាកំហុសខ្ពស់អាចជះឥទ្ធិពលអវិជ្ជមានដល់លទ្ធផលបណ្តុះបណ្តាល។ ការបណ្តុះបណ្តាលក៏មានតម្រូវការខ្នាតចង្កោមជាក់លាក់ផងដែរ ខណៈពេលដែលការទាមទារលើចង្កោមសម្រាប់ការសន្និដ្ឋានមិនមានភាពតឹងរ៉ឹងទេ ដូច្នេះការបន្ធូរបន្ថយតម្រូវការ GPU ។ បច្ចុប្បន្ន ដំណើរការនៃកាត H20 តែមួយរបស់ Nvidia មិនលើស Huawei ឬ Cambrian ទេ។ ភាពខ្លាំងរបស់វាស្ថិតនៅក្នុងចង្កោម។ ផ្អែកលើផលប៉ះពាល់ជារួមលើទីផ្សារថាមពលកុំព្យូទ័រ ស្ថាបនិកក្រុមហ៊ុន Luchen Technology លោក You Yang បានកត់សម្គាល់នៅក្នុងបទសម្ភាសន៍ជាមួយ AI Technology Review ថា "DeepSeek អាចនឹងធ្វើឱ្យខូចដល់ការបង្កើត និងជួលបណ្តុំកុំព្យូទ័របណ្តុះបណ្តាលដែលមានទំហំធំខ្លាំងជាបណ្តោះអាសន្ន។ ជំរុញឱ្យមានតម្រូវការប្រកបដោយនិរន្តរភាពនៅក្នុងទីផ្សារថាមពលកុំព្យូទ័រ។ លើសពីនេះទៀត "តម្រូវការកើនឡើងរបស់ DeepSeek សម្រាប់ការផ្តល់ហេតុផល និងសេវាកម្មកែតម្រូវគឺមានភាពស៊ីគ្នាជាមួយនឹងទិដ្ឋភាពកុំព្យូទ័រក្នុងស្រុក ដែលសមត្ថភាពក្នុងស្រុកមានភាពទន់ខ្សោយ ដើម្បីជួយកាត់បន្ថយកាកសំណល់ពីធនធានទំនេរក្រោយការបង្កើតចង្កោម នេះបង្កើតឱកាសដែលអាចសម្រេចបានសម្រាប់អ្នកផលិតនៅទូទាំងកម្រិតផ្សេងៗគ្នានៃប្រព័ន្ធអេកូកុំព្យូទ័រក្នុងស្រុក។" បច្ចេកវិទ្យា Luchen បានសហការជាមួយក្រុមហ៊ុន Huawei Cloud ដើម្បីបើកដំណើរការ APIs ហេតុផលស៊េរី DeepSeek R1 និងសេវាកម្មរូបភាពលើពពកដោយផ្អែកលើថាមពលកុំព្យូទ័រក្នុងស្រុក។ You Yang បានបង្ហាញសុទិដ្ឋិនិយមអំពីអនាគតថា៖ "DeepSeek បង្កើនទំនុកចិត្តលើដំណោះស្រាយដែលផលិតក្នុងស្រុក លើកទឹកចិត្តឱ្យមានភាពរីករាយកាន់តែខ្លាំង និងការវិនិយោគលើសមត្ថភាពកុំព្យូទ័រក្នុងស្រុកឆ្ពោះទៅមុខ"។

សេចក្តីសន្និដ្ឋាន
ថាតើ DeepSeek គឺ "ប្រសើរជាង" ជាង ChatGPT អាស្រ័យលើតម្រូវការ និងគោលបំណងជាក់លាក់របស់អ្នកប្រើប្រាស់។ សម្រាប់កិច្ចការដែលត្រូវការភាពបត់បែន ការចំណាយទាប និងការប្ដូរតាមបំណង DeepSeek ប្រហែលជាល្អជាង។ សម្រាប់ការសរសេរប្រកបដោយភាពច្នៃប្រឌិត ការសាកសួរទូទៅ និងចំណុចប្រទាក់សន្ទនាដែលងាយស្រួលប្រើ ChatGPT អាចនាំមុខគេ។ ឧបករណ៍នីមួយៗបម្រើគោលបំណងផ្សេងៗគ្នា ដូច្នេះជម្រើសនឹងពឹងផ្អែកយ៉ាងខ្លាំងទៅលើបរិបទដែលពួកវាត្រូវបានប្រើ។
ត្រួតពិនិត្យខ្សែ
ប្រព័ន្ធខ្សែកាបដែលមានរចនាសម្ព័ន្ធ
បណ្តាញ និងទិន្នន័យ, ខ្សែ Fiber-Optic, ខ្សែបំណះ, ម៉ូឌុល, បន្ទះមុខ
ថ្ងៃទី 16-18 ខែមេសា ឆ្នាំ 2024 ថាមពលមជ្ឈិមបូព៌ានៅឌូបៃ
ថ្ងៃទី 16-18 ខែមេសា ឆ្នាំ 2024 Securika នៅទីក្រុងមូស្គូ
ថ្ងៃទី 9 ខែឧសភា ឆ្នាំ 2024 ព្រឹត្តិការណ៍សម្ពោធផលិតផល និងបច្ចេកវិទ្យាថ្មីនៅទីក្រុងសៀងហៃ
ថ្ងៃទី 22-25 ខែតុលា ឆ្នាំ 2024 សន្តិសុខចិននៅទីក្រុងប៉េកាំង
ថ្ងៃទី 19-20 ខែវិច្ឆិកា ឆ្នាំ 2024 បានភ្ជាប់ KSA ពិភពលោក
ពេលវេលាផ្សាយ៖ ខែកុម្ភៈ-១០-២០២៥