ក្បួនដោះស្រាយនៅពីក្រោយតន្ត្រី
ក្បួនដោះស្រាយនៅពីក្រោយតន្ត្រី
ផ្លាស់ទីទៅលើ, American Idol ។
រឿងជោគជ័យធំបន្ទាប់នៅក្នុងឧស្សាហកម្មតន្ត្រីនឹងមិនត្រូវបានរកឃើញនៅក្នុងការប្រកួតប្រជែងដែលមានទេពកោសល្យខ្ពស់នោះទេ។ ផ្ទុយទៅវិញ វានឹងត្រូវបានកំណត់អត្តសញ្ញាណនៅក្នុងសំណុំទិន្នន័យដោយក្បួនដោះស្រាយស្មុគស្មាញដែលបានរចនាឡើងដើម្បីបង្ហាញពីការប្រើប្រាស់ និងនិន្នាការអាជីវកម្ម។
នៅលើផ្ទៃ វិធីសាស្រ្តនេះស្តាប់ទៅហាក់ដូចជាស្ងួត និងគ្មានអារម្មណ៍ជាងការរិះគន់របស់ Simon Cowell ប៉ុន្តែតាមពិតវាគឺជាវិធីចុងក្រោយដែលសាធារណជនជ្រើសរើស "រឿងធំបន្ទាប់"។ រាល់ពេលដែលសាធារណៈជនចុចលើតំណភ្ជាប់ YouTube បង្ហោះរូបថតការប្រគុំតន្ត្រីនៅលើ Twitter ឬជជែកអំពីក្រុមតន្ត្រីនៅលើ Facebook ពួកគេរួមចំណែកដល់ផ្នែកនៃព័ត៌មានដែលហៅថាទិន្នន័យធំ។ ពាក្យនេះសំដៅលើបណ្តុំនៃសំណុំទិន្នន័យដែលមានទំហំធំ និងមានទំនាក់ទំនងអន្តរកម្មស្មុគស្មាញ។ គិតអំពីរចនាសម្ព័ន្ធនៃបណ្តាញប្រព័ន្ធផ្សព្វផ្សាយសង្គម។ ពួកវាផ្ទុកនូវទម្រង់អ្នកប្រើប្រាស់ម្នាក់ៗរាប់លានដែលត្រូវបានភ្ជាប់ជាមួយគ្នាដោយមិត្តភាព 'ការចូលចិត្ត' សមាជិកភាពជាក្រុម និងផ្សេងៗទៀត។ ជាសំខាន់ ទិន្នន័យធំឆ្លុះបញ្ចាំងពីរចនាសម្ព័ន្ធនៃវេទិកាទាំងនេះ។
នៅក្នុងឧស្សាហកម្មតន្ត្រី ទិន្នន័យធំត្រូវបានបង្កើតឡើងដោយសកម្មភាពដូចជាការលក់តាមអ៊ីនធឺណិត ការទាញយក និងការទំនាក់ទំនងដែលធ្វើឡើងតាមរយៈកម្មវិធី ឬបរិយាកាសប្រព័ន្ធផ្សព្វផ្សាយសង្គម។ មាត្រដ្ឋានដែលបានវាស់វែងរួមមាន "ចំនួនដងបទចម្រៀងត្រូវបានចាក់ ឬរំលង ក៏ដូចជាកម្រិតនៃការទាក់ទាញដែលពួកគេទទួលបាននៅលើប្រព័ន្ធផ្សព្វផ្សាយសង្គម ដោយផ្អែកលើសកម្មភាពដូចជាការចូលចិត្ត Facebook និងធ្វីត។" ឧបករណ៍វិភាគកំណត់ប្រជាប្រិយភាពទូទៅនៃទំព័រអ្នកគាំទ្រ និងចុះឈ្មោះមតិវិជ្ជមាន ឬអវិជ្ជមានអំពីសិល្បករ។ ជាមួយគ្នានេះ ព័ត៌មាននេះកំណត់អត្តសញ្ញាណនិន្នាការបច្ចុប្បន្ន វាយតម្លៃជីពចរឌីជីថលរបស់សិល្បករ និងនាំទៅរកការលក់តាមរយៈបទចម្រៀងទោល ទំនិញ សំបុត្រប្រគុំតន្ត្រី និងសូម្បីតែការជាវសេវាកម្មចាក់តន្ត្រី។
ទាក់ទងនឹងការស្វែងរកអ្នកមានទេពកោសល្យថ្មី ទិន្នន័យធំដើរតួនាទីយ៉ាងសំខាន់ក្នុងការបង្កើតចំណាប់អារម្មណ៍លើស្លាកកំណត់ត្រាសំខាន់ៗ។ ក្នុងករណីជាច្រើន ក្រុមហ៊ុនរាប់ចំនួនចំនួនមើលទំព័ររបស់សិល្បករ 'ចូលចិត្ត' និងអ្នកតាម។ បន្ទាប់មក លេខអាចត្រូវបានប្រៀបធៀបយ៉ាងងាយស្រួលជាមួយនឹងសិល្បករផ្សេងទៀតនៅក្នុងប្រភេទដូចគ្នា។ នៅពេលដែលទង្វើមួយបានបង្កើតអ្នកតាមដាន Facebook ឬ Twitter មួយសែននាក់ អ្នកគ្រប់គ្រងទេពកោសល្យបានកត់សម្គាល់ ហើយចាប់ផ្តើមទាក់ទាញចំណាប់អារម្មណ៍នៅក្នុងឧស្សាហកម្មតន្ត្រីខ្លួនឯង។
ទិន្នន័យធំដែលជ្រើសរើសការវាយប្រហារកំពូលទាំង 40 ធំបន្ទាប់
សមត្ថភាពក្នុងការកំណត់អត្តសញ្ញាណនិន្នាការបច្ចុប្បន្ន និងទស្សន៍ទាយ megastar បន្ទាប់មកជាមួយនឹងរង្វាន់ហិរញ្ញវត្ថុដ៏ធំសម្រាប់អ្នកដែលពាក់ព័ន្ធ។ ជាឧទាហរណ៍ អ្នកវិទ្យាសាស្ត្រទិន្នន័យបានសិក្សាពីផលប៉ះពាល់នៃប្រព័ន្ធផ្សព្វផ្សាយសង្គមនៅលើអាល់ប៊ុម iTunes និងតាមដានការលក់ដោយប្រៀបធៀបរង្វាស់របស់មនុស្សម្នាក់ជាមួយនឹងចំណូលរបស់អ្នកដទៃ។ ពួកគេបានសន្និដ្ឋានថាសកម្មភាពប្រព័ន្ធផ្សព្វផ្សាយសង្គមទាក់ទងទៅនឹងការកើនឡើងនៃអាល់ប៊ុម និងតាមដានការលក់។ ពិសេសជាងនេះទៅទៀត ការមើល YouTube មានឥទ្ធិពលធំបំផុតលើការលក់។ ការរកឃើញដែលបានជំរុញឱ្យស្លាកសំឡេងជាច្រើនដើម្បីផ្ទុកឡើងវីដេអូតន្ត្រីថវិកាដ៏ធំនៅលើវេទិកាដើម្បីផ្សព្វផ្សាយការនៅលីវ។ មុនពេលចំណាយប្រាក់រាប់លានលើការផលិតវីដេអូ ការវិភាគត្រូវបានប្រើដើម្បីកំណត់ថាបទចម្រៀងណាដែលទំនងជាទទួលបានការពេញនិយមដោយផ្អែកលើសកម្មភាពអនឡាញនៃទស្សនិកជនគោលដៅ។ ភាពត្រឹមត្រូវនៃការទស្សន៍ទាយទាំងនេះគឺទាក់ទងទៅនឹងគុណភាពនៃការវិភាគទិន្នន័យធំ។
សហគ្រិននៅក្នុងឧស្សាហកម្មតន្ត្រីឥឡូវនេះកំពុងពិសោធជាមួយវិធីសាស្រ្តថ្មីដើម្បីបង្កើតក្បួនដោះស្រាយដែលប្រមូលព័ត៌មានប្រកបដោយប្រសិទ្ធភាព និងភាពត្រឹមត្រូវជាងមុន។ ឧទាហរណ៍មួយក្នុងចំណោមឧទាហរណ៍ដែលគួរឱ្យកត់សម្គាល់បំផុតគឺការបណ្តាក់ទុនរួមគ្នារវាង EMI Music និង Data Science London ដែលហៅថា The EMI Million Interview Dataset។ វាត្រូវបានពណ៌នាថាជា "សំណុំទិន្នន័យការសរសើរតន្ត្រីដ៏មានបំផុត និងធំបំផុតដែលមិនធ្លាប់មាន - សំណុំទិន្នន័យដ៏ធំ ពិសេស សម្បូរបែប និងគុណភាពខ្ពស់ដែលចងក្រងពីការស្រាវជ្រាវជាសាកល ដែលមានចំណាប់អារម្មណ៍ អាកប្បកិរិយា អាកប្បកិរិយា ភាពស្គាល់ និងការដឹងគុណចំពោះតន្ត្រី ដូចដែលបានបង្ហាញដោយ អ្នកគាំទ្រតន្ត្រី។”
David Boyle អនុប្រធានជាន់ខ្ពស់ផ្នែក Insight នៅ EMI Music ពន្យល់ថា “(វាគឺ) រួមមានការសម្ភាសន៍មួយលានដែលនិយាយអំពីប្រធានបទដូចជាកម្រិតនៃចំណង់ចំណូលចិត្តសម្រាប់ប្រភេទតន្ត្រីជាក់លាក់មួយ និងប្រភេទរង វិធីសាស្រ្តដែលពេញចិត្តសម្រាប់ការស្វែងរកតន្ត្រី សិល្បករតន្ត្រីដែលចូលចិត្ត។ គំនិតលើការលួចចម្លងតន្ត្រី ការផ្សាយតន្ត្រី ទម្រង់តន្ត្រី និងប្រជាសាស្រ្តអ្នកគាំទ្រ។
គោលដៅនៃគម្រោងគឺដើម្បីបញ្ចេញបណ្តុំព័ត៌មាននេះជាសាធារណៈ និងកែលម្អគុណភាពអាជីវកម្មក្នុងឧស្សាហកម្មតន្ត្រី។
Boyle និយាយថា "យើងបានទទួលជោគជ័យយ៉ាងខ្លាំងក្នុងការប្រើប្រាស់ទិន្នន័យដើម្បីជួយយើង និងសិល្បកររបស់យើងឱ្យយល់ពីអ្នកប្រើប្រាស់ ហើយយើងពិតជារំភើបក្នុងការចែករំលែកទិន្នន័យមួយចំនួនរបស់យើង ដើម្បីជួយអ្នកដទៃឱ្យធ្វើដូចគ្នា" Boyle និយាយ។
ក្នុងឆ្នាំ 2012 EMI Music និង Data Science London បានយកគម្រោងនេះមួយជំហានទៀតដោយរៀបចំកម្មវិធី Music Data Science Hackathon ។ EMC ដែលជាក្រុមហ៊ុនឈានមុខគេលើពិភពលោកក្នុងផ្នែកវិទ្យាសាស្ត្រទិន្នន័យ និងដំណោះស្រាយទិន្នន័យធំ បានចូលរួមក្នុងការបណ្តាក់ទុន និងផ្តល់ហេដ្ឋារចនាសម្ព័ន្ធព័ត៌មានវិទ្យា។ ក្នុងរយៈពេល 24 ម៉ោង អ្នកវិទ្យាសាស្ត្រទិន្នន័យចំនួន 175 នាក់បានបង្កើតរូបមន្ត និងក្បួនដោះស្រាយចំនួន 1,300 ដើម្បីឆ្លើយសំណួរថា "តើអ្នកអាចទស្សន៍ទាយបានថាតើអ្នកស្តាប់នឹងចូលចិត្តបទចម្រៀងថ្មីដែរឬទេ?" លទ្ធផលបានចង្អុលបង្ហាញអំពីថាមពលនៃបញ្ញាសមូហភាព ហើយអ្នកចូលរួមបានបង្កើតរូបមន្តដែលត្រូវបានពិពណ៌នាថាជាលំដាប់ពិភពលោក។
លោក Chris Roche នាយកប្រចាំតំបន់សម្រាប់ EMC Greenplum មានប្រសាសន៍ថា "ការយល់ដឹងដែលបានបង្ហាញនៅក្នុង hackathon នេះបង្ហាញពីថាមពល និងសក្តានុពលដែលទិន្នន័យធំមាន ទាំងការរកឃើញបញ្ញា និងសម្រាប់តម្លៃអាជីវកម្មបន្ថែមសម្រាប់អង្គការគ្រប់ប្រភេទ" បាននិយាយថា Chris Roche នាយកប្រចាំតំបន់សម្រាប់ EMC Greenplum ។
ប៉ុន្តែតើអ្នកបង់ប្រាក់ឱ្យសិល្បករដោយរបៀបណា?
បន្ទាប់ពីឧស្សាហកម្មបានកំណត់ថាបទចម្រៀងមួយបទមានសក្តានុពល ហើយបានចេញផ្សាយជាបទចម្រៀងមួយ តើវាគណនាតម្លៃសួយសារអាករដោយរបៀបណា នៅពេលដែលបទចម្រៀងនេះត្រូវបានចាក់នៅលើវេទិកាប្រព័ន្ធផ្សព្វផ្សាយសង្គម ឬគេហទំព័រស្ទ្រីម? ឥឡូវនេះ "ស្លាកកំណត់ត្រាគ្រប់ទំហំប្រឈមមុខនឹងបញ្ហាកាន់តែខ្លាំងឡើងនៃការត្រូវផ្សះផ្សាទិន្នន័យឡើងវិញពីក្រុមហ៊ុនផ្សាយដូចជា Spotify, Deezer និង YouTube ប៉ុន្តែមានមនុស្សតិចជាងមុនដើម្បីធ្វើដូច្នេះ។"
បញ្ហាប្រឈមកណ្តាលមួយពីទស្សនៈនៃការគ្រប់គ្រងព័ត៌មានគឺថាប្រព័ន្ធគ្រប់គ្រងមូលដ្ឋានទិន្នន័យភាគច្រើនមិនត្រូវបានបង្កើតឡើងដើម្បីដោះស្រាយសំណុំទិន្នន័យដែលមានទំហំធំ និងស្មុគស្មាញដូចទិន្នន័យធំនោះទេ។ ជាឧទាហរណ៍ ទំហំនៃឯកសារទិន្នន័យឌីជីថលដែលបង្កើតដោយអ្នកចែកចាយតន្ត្រីគឺលើសពីអ្វីដែលកម្មវិធីដូចជា Excel អាចគ្រប់គ្រងបាន។ វាបង្កើតបញ្ហារួមទាំងបាត់ទិន្នន័យ និងស្លាកឯកសារដែលមិនត្រូវគ្នាជាមួយកម្មវិធីគណនេយ្យ។
ក្នុងករណីភាគច្រើន បញ្ហាទាំងអស់នេះត្រូវបានតម្រៀបចេញដោយគណនេយ្យករ ដោយបន្ថែមពេលវេលា និងកម្លាំងពលកម្មបន្ថែមទៅនឹងបន្ទុកការងារដ៏ធ្ងន់រួចទៅហើយ។ ក្នុងករណីជាច្រើន ភាគច្រើននៃតម្លៃលើសរបស់ស្លាកត្រូវបានភ្ជាប់ក្នុងនាយកដ្ឋានគណនេយ្យ។
ដើម្បីប្រយុទ្ធប្រឆាំងនឹងបញ្ហាទាំងនេះ សហគ្រិនបង្កើតវេទិកាស៊ើបការណ៍អាជីវកម្មដែលមានសមត្ថភាពរៀបចំ និងវិភាគទិន្នន័យធំ។ ឧទាហរណ៍មួយក្នុងចំណោមឧទាហរណ៍ដ៏ល្អបំផុតគឺក្រុមហ៊ុនអូទ្រីស Rebeat ដែលពណ៌នាអំពីសេវាកម្មរបស់ពួកគេថាជា "គណនីកម្មសិទ្ធិដោយការចុចបីដង" ។ បង្កើតឡើងក្នុងឆ្នាំ 2006 វាបានរីកចម្រើនយ៉ាងឆាប់រហ័សទៅជាអ្នកចែកចាយឌីជីថលឈានមុខគេនៅអឺរ៉ុប និងផ្តល់នូវការចូលទៅកាន់សេវាឌីជីថលចំនួន 300 នៅទូទាំងពិភពលោក។ ជាសំខាន់ Rebeat សម្រួលការអនុវត្តគណនេយ្យ និងគ្រប់គ្រងការងារផ្នែកខាងក្រោយ ដូចជាការផ្គូផ្គងទិន្នន័យនៅក្នុងកម្មវិធីគណនេយ្យ ដូច្នេះនាយកដ្ឋានគណនេយ្យមានសេរីភាពក្នុងការគ្រប់គ្រងថវិកា។ ពួកគេក៏ផ្តល់ហេដ្ឋារចនាសម្ព័ន្ធដើម្បីគ្រប់គ្រងការទូទាត់ថ្លៃសួយសារអាករដោយអនុលោមតាមកិច្ចព្រមព្រៀងកិច្ចសន្យា កិច្ចព្រមព្រៀងផ្ទាល់ជាមួយហាងលក់តន្ត្រីឌីជីថល បង្កើតក្រាហ្វដើម្បីតាមដានការលក់ ហើយសំខាន់បំផុតគឺការនាំចេញទិន្នន័យទៅក្នុងឯកសារ CSV ។
ជាការពិតណាស់ សេវាមកជាមួយតម្លៃ។ ទស្សនាវដ្ដី Forbes បានរាយការណ៍ថា ស្លាកកំណត់ត្រាត្រូវតែប្រើ Rebeat ជាអ្នកចែកចាយ ដូច្នេះពួកគេអាចចូលប្រើទិន្នន័យរបស់ក្រុមហ៊ុន ដែលមានតម្លៃកម្រៃជើងសារលក់ 15% និងថ្លៃថេរចំនួន $649 ក្នុងមួយឆ្នាំ។ ទោះយ៉ាងណាក៏ដោយ ការប៉ាន់ប្រមាណណែនាំថា ក្នុងករណីភាគច្រើន ការត្រួតលើគណនីរបស់ស្លាកមួយ ជារឿយៗមានតម្លៃថ្លៃជាងនេះ ដែលមានន័យថា ការចុះហត្ថលេខាជាមួយ Rebeat អាចក្លាយជាការសន្សំប្រាក់។