
The Future is Insight : สรุปสาระสำคัญจากงาน Big Data LDN 2025
เรียบเรียงโดย น.ส. ชญานิน วังซ้าย หัวหน้างานมาตรฐานข้อมูล

อนาคตของการจัดการข้อมูลจะเป็นอย่างไรในโลกที่ปริมาณข้อมูลเพิ่มขึ้นอย่างเท่าทวีคูณในทุก ๆ วินาที ในอนาคตที่เราไม่จำเป็นต้องเขียนโค้ดหรือโปรแกรมแต่สามารถ “พูด” หรือ “สั่ง” ข้อมูลได้เลย หน้าที่ของคนทำงานด้านข้อมูลจะเปลี่ยนไปอย่างไร เราสามารถใช้ประโยชน์จาก AI เพื่อสร้าง “ผลิตภัณฑ์ข้อมูล” ที่ใช้งานง่าย รวดเร็ว น่าเชื่อถือ และเพิ่มมูลค่าให้กับองค์กรได้อย่างไร
ในงาน Big Data LDN 2025 งานประชุมและจัดแสดงนิทรรศการด้านข้อมูลขนาดใหญ่ การวิเคราะห์ และประยุกต์ใช้ปัญญาประดิษฐ์ที่ใหญ่ที่สุดของสหราชอาณาจักร จัดขึ้นที่ Olympia กรุงลอนดอน เมื่อวันที่ 24-25 กันยายน 2568 วิทยากรผู้เชี่ยวชาญจากบริษัทชั้นนำทั่วโลกได้ร่วมให้ข้อเสนอแนะต่อแนวทางการจัดการข้อมูลเพื่อพัฒนาธุรกิจที่ใช้ประโยชน์จากข้อมูลได้อย่างเต็มศักยภาพ ผ่านกรณีศึกษาที่ประสบความสำเร็จจากธุรกิจระดับโลก โดยมีประเด็นสำคัญที่น่าสนใจดังต่อไปนี้

The Future is Automated
ความท้าทายจากการพัฒนาและแพร่หลายอย่างกว้างขวางของเทคโนโลยี AI โดยเฉพาะ Generative และ Agentic AI ทำให้ปริมาณข้อมูลที่ธุรกิจได้รับจากช่องทางต่าง ๆ เพิ่มขึ้นตลอดเวลา ก้อนข้อมูลขนาดมหึมานี้อาจทำให้เกิดภาวะ“วุ่นวาย” (Chaos) ได้หากหน่วยงานไม่สามารถบริหารจัดการข้อมูลได้อย่างทันท่วงที ในขณะเดียวกัน AI เองก็ต้องการข้อมูลที่มีความถูกต้อง ครบถ้วน และเป็นปัจจุบัน เพื่อป้อนเป็นอาหารสำหรับวิเคราะห์ประมวลผลให้กับผู้ใช้ ซึ่งหากข้อมูลที่ AI ได้รับขาดคุณภาพ คำตอบหรือ Output ก็จะด้อยคุณภาพเช่นกัน ดังประโยคที่ได้ยินกันบ่อย ๆ ว่า “Garbage in, garbage out” ดังนั้นสามารถสรุปได้ว่า ข้อมูลที่ดีคือพื้นฐานที่จำเป็นสำหรับ AI และหากไม่มีการจัดการข้อมูลที่ดี โปรเจค AI ทั้งหลายก็มักจะไม่รอดเช่นกัน
ด้วยเหตุนี้ การกำกับดูแลข้อมูลในอนาคตจึงมีความจำเป็นต้องปรับเปลี่ยนวิธีการอย่างสิ้นเชิง โดยต้องเปลี่ยนเป็นการกำกับเชิงรุกที่ครอบคลุมประเด็นทั้งคุณภาพข้อมูล ความเป็นส่วนบุคคล ความมั่นคงปลอดภัย การใช้และแบ่งปันข้อมูล รวมทั้งต้องมีการใช้เทคโนโลยี AI เข้ามาช่วยติดตามข้อมูลตลอดเวลา เช่น ระบบบัญชีข้อมูล (Data Catalog) ที่สามารถช่วยค้นหาชุดข้อมูลและคำอธิบาย (Metadata) หรือสามารถจับความผิดปกติของข้อมูลและรายงาน/แจ้งเตือนทีมผู้ดูแลข้อมูลได้โดยอัตโนมัติ นอกจากนี้ระบบจัดการข้อมูลในอนาคตต้องมีความยืดหยุ่นและสามารถรองรับการเติบโตของปริมาณข้อมูลขนาดใหญ่ได้
การเติบโตของ Generative AI ทำให้ปริมาณข้อมูลราว 80-85% เป็นข้อมูลชนิดไม่มีโครงสร้าง (Unstructured Data) ทำให้การบริหารจัดการข้อมูลในระยะต่อไปจำเป็นต้องขยายขอบเขตจากเดิมที่เน้นเพียงข้อมูลประเภทโครงสร้างและกึ่งโครงสร้างไปสู่การจัดการข้อมูลทุกรูปแบบ โดยข้อมูลชนิดไม่มีโครงสร้างสามารถนำไปใช้ในการวิเคราะห์ได้ผ่านการกำหนดแท็ก (Tagging) และประเภทหมวดหมู่ (Taxonomy) โดยใช้ประโยชน์จากโมเดลภาษาขนาดใหญ่ นอกจากนี้ ในปัจจุบันเราสามารถใช้ AI เพื่อคัดเลือก Entities และความสัมพันธ์จากข้อมูลไม่มีโครงสร้างและวิเคราะห์ร่วมกับ Metadata จากข้อมูลประเภทโครงสร้างเพื่อสร้าง “กราฟความรู้”ขององค์กร ธุรกิจจำเป็นต้องสร้างระบบการกำกับดูแลที่ครอบคลุมการบริหารจัดการข้อมูลรูปแบบใหม่นี้ รวมทั้งต้องทบทวนขอบเขตของ “คำอธิบายข้อมูล” (Metadata) ให้เอื้อต่อการทำงานของทั้งมนุษย์และ AI มากขึ้น

The Future is Integrated
ความท้าทายในการจัดการข้อมูลนับแต่อดีตถึงปัจจุบันคือข้อมูลที่กระจัดกระจายอยู่หลายแหล่ง หรือจัดเก็บแบบแยกส่วน (Data Silo) การเพิ่มขึ้นของผลิตภัณฑ์ซอฟแวร์ข้อมูลในปัจจุบันกลับสร้างไซโลข้อมูลรูปแบบใหม่จำนวนมากที่มีมาตรฐานต่างกัน ในระยะอันใกล้ AI Agent จะสามารถช่วยผู้ดูแลหรือบริกรข้อมูลมนุษย์ (Data Steward) ในการกำกับดูแลข้อมูลที่กระจัดกระจายเหล่านี้ โดยองค์กรควรเริ่มพัฒนาแพลตฟอร์มรวมศูนย์การกำกับดูแลข้อมูลที่ใช้ AI เป็นตัวช่วย โดยรากฐานที่สำคัญของระบบแพลตฟอร์มนี้ก็คือคำอธิบายข้อมูล หรือ Metadata ที่แชร์ร่วมกันทั้งองค์กรนั่นเอง
“Data Fabric” คือแนวคิดสถาปัตยกรรมข้อมูลรูปแบบหนึ่งที่มุ่งเน้นการรวบรวมข้อมูลขององค์กรที่กระจายอยู่ตามแหล่งต่าง ๆ ให้เป็นผืนผ้าเนื้อเดียวกัน เชื่อมโยงโดย Metadata ในระบบบริหารจัดการข้อมูลเช่นนี้ ผู้ดูแลข้อมูลสามารถดำเนินการตามกรอบกระบวนงานที่เกี่ยวข้องโดยมี Agentic AI เป็นผู้ช่วย ทั้งในการจัดเก็บ รวมรวม ตรวจสอบความถูกต้อง ปลอดภัย ความเป็นส่วนบุคคลของข้อมูล การใช้และการแบ่งปันข้อมูล ข้อดีของสถาปัตยกรรมแบบ Data Fabric คือการใช้ประโยชน์จาก Metadata ที่มีอยู่แล้วในการเชื่อมโยงข้อมูลของหน่วยงานให้อยู่ใน Framework เดียวกัน โดยมีความยืดหยุ่นในการเข้าถึงและย้ายข้อมูลข้ามแพลตฟอร์ม
สิ่งที่จำเป็นสำหรับสถาปัตยกรรมข้อมูลในอนาคตจึงไม่ใช่เพียงแค่การพัฒนาแพลตฟอร์มหรือระบบสำหรับจัดการข้อมูล แต่คือการกำหนดชั้นความหมายของข้อมูล (Semantic Layer) เพื่อให้ข้อมูลของหน่วยงานจากแหล่งต่าง ๆ มีนิยามความหมายที่สอดคล้องกัน นอกจากนี้การจัดทำโครงสร้างความรู้ของหน่วยงานที่เป็นอันหนึ่งอันเดียวกัน (Unified Enterprise Ontology) ก็เป็นอีกหนึ่งความท้าทายสำหรับผู้ดูแลข้อมูลขององค์กรหรือธุรกิจในอนาคต โดยผู้เชี่ยวชาญมีความเห็นว่าธุรกิจที่มีโครงสร้างความรู้ที่เชื่อมโยงกันอย่างสมบูรณ์ภายในหน่วยงานนั้นน่าจะเป็นไปได้ตั้งแต่ประมาณปี 2571 หรือ 2572 เป็นต้นไป

The Future is Value-Driven Insight
ประเด็นที่ถูกเน้นย้ำในหลายเวทีในงาน Big Data LDN ปีนี้คือ ท้ายสุดแล้วข้อมูลปริมาณมหาศาลเหล่านี้จะสร้างมูลค่าเพิ่มให้กับองค์กรหรือธุรกิจได้อย่างไร ในความเป็นจริงแม้ว่าบริษัทหรือองค์กรจะสามารถเก็บข้อมูลได้มากขึ้น แต่รายงานจาก International Data Corporation ในปี 2024 พบว่าข้อมูลราว 68% ขององค์กรไม่ได้ถูกนำไปใช้ นั่นคือบริษัทหรือองค์กรทั่วไปใช้ข้อมูลเพียง 1 ใน 3 ของข้อมูลที่มีอยู่เท่านั้น ปัญหาเกิดจากการที่แผนกธุรกิจขององค์กรไม่ได้มีส่วนร่วมในกระบวนการบริหารจัดการข้อมูลตั้งแต่ต้น แต่ในปัจจุบันที่มูลค่าของข้อมูลหรือ ROI ของการลงทุนด้านข้อมูลถูกวัดจากการนำมาใช้ หน่วยงานจำเป็นต้องมีมาตรการเพื่อให้ข้อมูลถูกนำมาใช้ขับเคลื่อนเป้าหมายทางธุรกิจขององค์กรอย่างเป็นรูปธรรม
การสร้าง “ผลิตภัณฑ์ข้อมูล” (Data Product) เป็นการคัดเลือกและรวบรวมทรัพยากรข้อมูลที่มีคุณค่าขององค์กรและนำมาจัดแสดงให้ผู้ใช้สามารถค้นหาข้อมูลและเข้าถึงได้ตามสิทธิ์ที่กำหนด ผลิตภัณฑ์ข้อมูลทำให้ข้อมูลขององค์กรมีความพร้อมใช้ ไม่ใช่เฉพาะสำหรับทีมผู้ดูแลข้อมูลแต่สำหรับฝ่ายธุรกิจด้วย โดยประโยชน์ของ Data Product คือสามารถเพิ่มมูลค่าทางธุรกิจให้กับข้อมูลผ่านการนำไปใช้ที่เพิ่มขึ้น (Increase adoption) เนื่องจากมีความสะดวกรวดเร็วในการเข้าถึง คล้าย ๆ กับเว็บ E-commerce สามารถขยายตัวเพื่อรองรับปริมาณข้อมูลที่เพิ่มขึ้นได้ (Scalable) ทำให้ทีมบริกรข้อมูลสามารถกำกับดูแลข้อมูลได้อย่างครบถ้วนตลอดวงจรชีวิต อีกทั้งยังสามารถอำนวยความสะดวกในการเปิดเผยและแบ่งปันข้อมูลของหน่วยงานได้อีกด้วย
การแพร่หลายของ AI ทำให้การดำเนินงานด้านข้อมูลเริ่มเปลี่ยนจากที่บริหารจัดการโดยผู้เชี่ยวชาญด้านเทคนิกจากแผนก IT เพียงฝ่ายเดียว เป็นการที่ผู้มีส่วนได้ส่วนเสียจากแผนกธุรกิจ วางแผน ฯลฯ เข้ามามีส่วนร่วมในการจัดการข้อมูลด้วย ตัวอย่างเช่น การสร้างผลิตภัณฑ์ข้อมูลที่ตอบโจทย์ทางธุรกิจจำเป็นต้องมีการสร้างชั้นความหมายข้อมูลทางธุรกรรม (Business Semantic Layer) ที่ครบถ้วนและครอบคลุมความต้องการของผู้ใช้ข้อมูลจริง ๆ ซึ่งต้องอาศัยเจ้าหน้าที่ฝ่ายธุรกิจร่วมกำหนดด้วย ในการเพิ่มมูลค่าข้อมูลของหน่วยงานจึงจำเป็นต้องอาศัยความร่วมมือจากบุคลากรทั่วทั้งองค์กร โดยควรมีการกำหนดยุทธศาสตร์ข้อมูลเพื่อให้ผู้เกี่ยวข้องแต่ละส่วนสามารถใช้ความเชี่ยวชาญตามบทบาทของตนเพื่อพัฒนาคลังข้อมูลขององค์กรต่อไป
Key Takeaway:
- การแพร่หลายของ AI ทำให้การกำกับดูแลข้อมูลในอนาคตต้องอาศัยบริกรข้อมูลทั้งที่เป็น Agentic AI และมนุษย์ เพื่อให้สามารถตรวจสอบและจัดการข้อมูลปริมาณมหาศาลที่เพิ่มขึ้นตลอดเวลาได้อย่างอัตโนมัติ ทั้งนี้ บริกรข้อมูลมนุษย์ยังมีบทบาทสำคัญในการกำกับดูแลขั้นสุดท้าย
- องค์กรส่วนใหญ่มักพบปัญหาจากข้อมูลที่จัดเก็บอยู่ต่างแหล่งกัน สถาปัตยกรรมข้อมูลแบบผืนผ้าเเป็นแนวโน้มการจัดการข้อมูลเพื่อตอบโจทย์นี้โดยใช้ประโยชน์จาก Metadata ในการเชื่อมโยงข้อมูลของหน่วยงานให้อยู่ใน Framework เดียวกัน
- ท้ายสุดแล้วเป้าหมายของทุกหน่วยงานคือ เราจะใช้ข้อมูลในการสร้างมูลค่าเพิ่มให้กับองค์กรได้อย่างไร ความร่วมมือจากบุคลากรในทุกแผนกที่เกี่ยวข้องในการสร้าง Data Product ที่พร้อมใช้และตอบโจทย์ทางธุรกิจเป็นอีกหนึ่งแนวโน้มของการจัดการข้อมูลในระยะต่อไป
แหล่งข้อมูล: สรุปสาระสำคัญจากการบรรยายและเสวนาในงาน Big Data LDN 2025
- “Metadata Management in the Age of AI” บรรยายโดย Ole Olensen-Bagneux, Actian
- “How UK Power Networks turns data into insight, innovation, and performance – The strategic power of Data Product” บรรยายโดย Matt Webb, UK Power Networks และ Opendatasoft
- “Humanizing Data Strategy” บรรยายโดย Tiankai Feng, Thoughtworks
- “Data Stewardship: Past, Present & Future in the age of AI” บรรยายโดย Peter Kapur ผู้เชี่ยวชาญ Data Strategy & Data Governance
- “Strategy First: Empowering the Business to lead in the AI Era” บรรยายโดย Adrian Estala, Starburst
- “Implementing a Data Governance Framework Using Data Products” บรรยายโดย Damien Julliard, IAG Loyalty
- “Putting Business Users First: How to Maximize the Business Value of Your Data” บรรยายโดย Petr Beles, Datavault Builder
- “Unlocking Decision Making Through Data” บรรยายโดย Hazal Muhtar, Mixpanel
- “Driving Effective Decision Making – It is Not Just About Tech” เสวนาโดย Caro Ames และ Anush Newman JMAN Group
- “Continuous, Agentic and Automated Data Governance – Ensuring a High Quality Compliant Data Foundation for AI Success” บรรยายโดย Mike Ferguson, Big Data LDN