19 มกราคม 2554

Lecture#9 - 19 Jan 2011

Business Intelligence(BI)
                คือเครื่องมือสำหรับวิเคราะห์ข้อมูล ที่มีการผสมผสานกันระหว่าง Architectures, Tools, Database, Applications และ Methodologies โดยผู้บริหารจะใช้ข้อมูล Data Warehouse ผ่าน BI ซึ่งกระบวนการของ BI จะเป็นการแปลงข้อมูลให้กลายเป็นสารสนเทศ ซึ่งมีจุดประสงค์เพื่อนำสารสนเทศที่ได้ไปใช้ในการตัดสินใจ และนำไปปฏิบัติ
BI Functions
                จะเป็นการ Interface ระหว่างผู้ใช้กับระบบงาน โดยมีทั้งหมด 3 Functions
1.       Reporting and Analysis : Function ในการออก Report เช่น Scorecards, Dashboards
2.       Analytic : เครื่องมือในการวิเคราะห์ เช่น  Data, Text and Web mining, OLAP
3.       Data Integration : ETL ซึ่งอยู่ในส่วนของ Warehouse
BI Vendors
                ปัจจุบันนั้นมีผู้ให้บริการเครื่องมือวิเคราะห์ข้อมูล BI หลากหลายราย เช่น IBM, SAP, ORACLE, Microsoft เช่น
Dashboards & Scorecards
                Dashboards มักจะเป็นการวิเคราะห์การดำเนินงานในการนำไปใช้สำหรับผู้ใช้ระดับ Strategic level โดยความสามารถที่ Dashboards จะต้องนำเสนอได้ไม่ว่าจะเป็น BI จากยี่ห้อไหน ได้แก่ Drill-down, Critical success factors(CSFs), Key performance indicators(KPI), Status access, Trend analysis, Ad-hoc analysis, Exception reporting และเนื่องจากองค์กรแต่ละแห่งจำเป็นต้องวัดผลในทุกๆระดับ Dashboards จึงแบ่งออกเป็น 3 กลุ่ม ได้แก่
1.       Operational dashboards : ผู้ใช้งานคือ Front line workers และ Supervisor
2.       Tactical dashboards : ผู้ใช้งานคือ Manager และ Analysts
3.       Strategic dashboards : ผู้ใช้งานคือ Executive และ Manager
                ส่วน Scorecards นั้นจะใช้ใน Performance Measurement สำหรับ Executive, Manager และผู้ใช้ระดับ Strategic level
Business Performance Management(BPM)
                แต่ละยี่ห้อจะไม่เหมือนกัน โดยจะเป็น Function ที่อาจจะรวมหรือแยกกับ BI ก็ได้ ซึ่ง BPM จะช่วยทำให้การวัด Performance ขององค์กรรวดเร็วและง่ายยิ่งขึ้น นอกจากนี้ BPM จะดีแค่ไหนจะขึ้นอยู่กับ BI ขององค์กรด้วย เนื่องจากการที่เราจะวิเคราะห์ให้ดีนั้น เราจะต้องมีรายละเอียดของข้อมูลที่มากพอ และเราจะต้องมี Multidimensional Data ที่ชัดเจน เพราะจะช่วยให้เราทำ Slice and Dice ได้ชัด
                ซึ่งการวิเคราะห์ของ BI นั้นจะช่วยให้เรารู้จักลูกค้าดีขึ้น สามารถตอบสนองความต้องการของลูกค้าได้มากขึ้น รู้ช่องทางที่จะเข้าถึงลูกค้าในแต่ละกลุ่ม ซึ่งจะทำให้เราทำ CRM ได้ง่ายขึ้นด้วย
Data Mining
                เป็นกระบวนการค้นหาสารสนเทศ หรือข้อความที่อยู่ในฐานของมูลขนาดใหญ่ที่ซับซ้อน เพื่อนำความรู้ที่ได้ไปใช้ประโยชน์ในการตัดสินใจ เป็นการค้นหา Pattern ที่เราไม่เคยรู้มาก่อน แล้ว Predict trends เช่น ธนาคารจะใช้ในการดูว่าการใช้บัตรเครดิตปลอมหรือบัตรเครดิตที่ขโมยมามีลักษณะอย่างไร
                โดยกระบวนการของ Data Mining จะเริ่มที่เราจะต้องมีข้อมูลโดยจะเป็นขอมูลจาก Data Warehouse หรือจากไหนก็ได้ แล้วผ่านกระบวนการ ETL เนื่องจาก ETL ของ Data Warehouse กับ Mining นั้นไม่เหมือนกัน หลังจากนั้นก็จะผ่าน Software Mining แล้ว Output ที่ได้นั้นยังไม่ใช่ Output แบบที่คาดหวัง เราจะต้องนำ Output นั้นไปวิเคราะห์ผลเสียก่อน
                ผลของ Data Mining มีทั้งหมด 5 รูปแบบซึ่งขึ้นอยู่กับว่าเราต้องการแสดงผลในรูปแบบไหน
1.       Clustering : ไม่มีสมมติฐานในการ Classify
2.       Classification : มีสมมติฐานในการ Classify โดยเราจะทำเพื่อพิสูจน์ว่าสมมติฐานเราจริงหรือไม่
3.       Association : เป็นผลสืบเนื่อง เช่น ลูกค้าเปิดบัญชีออมทรัพย์ แล้ว 45% ของลูกค้ากลุ่มนั้นจะเปิด ATM ด้วย
4.       Sequence discovery : Consequence ที่เกิดขึ้นตามหลังมา
5.       Prediction : อนาคตข้างหน้า
Text Mining
                การ Mining ด้วยระบบ Text Mining จะใช้กับข้อมูล Non-structured ข้อมูลที่ไม่สามารถคำนวณได้ เนื่องจากข้อมูลเหล่านั้นมีประโยชน์กับองค์กร เช่น ข้อมูล Complain ของลูกค้า โดยการค้นหาเนื้อหาสาระที่ซ่อนอยู่ในข้อมูลนั้น หาผู้ที่มีการ Complain ในเรื่องที่คล้ายๆกัน และเรื่องที่มีความสัมพันธ์กัน การหาคำที่ Common กัน เช่น headache, fever, temperature, vomit, symptom เป็นต้น

12 มกราคม 2554

Lecture#8 - 12 Jan 2011

Data Management
Needs of data management
                การบริหารจัดการข้อมูลเป็นสิ่งจำเป็นเนื่องจากข้อมูลจะมีมากขึ้นเรื่อยๆ และเราไม่ได้ต้องเก็บข้อมูลทุกอย่าง อีกทั้งองค์กรแต่ละองค์กรต่างก็มีข้อมูลกระจายอยู่ทั่วองค์กร ทำให้ข้อมูลจำนวนมากเหล่านั้นที่กระจัดกระจายอยู่ในแผนกต่างๆมีความซ้ำซ้อนกันได้ โดยการจัดการข้อมูลขึ้นอยู่กับพื้นฐาน 3 ประการได้แก่
1.       Security
2.       Quality
3.       Integrity
โดยเป้าหมายของการจัดการข้อมูลนั้น คือการพยายามสร้างระบบ database ให้ครอบคลุมพื้นฐาน 3 ประการที่กล่าวไปในขั้นต้น หากองค์กรมีระบบ databaseที่ดี ก็จะส่งผลให้องค์กรมีสารสนเทศที่มีคุณภาพสูง สามารถนำไปใช้ประโยชน์ในการตัดสินใจได้ดียิ่งขึ้น

Data Life Cycle Process
                วงจรของข้อมูลเริ่มจากการเก็บข้อมูลจากแหล่งต่างๆทั้งภายในและภายนอกองค์กร โดยชนิดของข้อมูลมี 3 ชนิด
1.       Internal data
ข้อมูลภายใน ซึ่งเป็นหัวใจสำคัญขององค์กร โดยเป็นข้อมูลในระดับ Transaction Processing System (TPS) การจัดการข้อมูลจากแหล่งกำเนิดมีความจำเป็น ข้อมูลเหล่านี้ควรจะถูกต้องครบถ้วน ตามแนวคิด Garbage-In, Garbage-Out
2.       External data
เป็นข้อมูลจากภายนอก ซึ่งข้อมูลเหล่านี้เราสามารถหาได้จาก Website ต่างๆ หรืออาจได้จากการซื้อขายข้อมูลก็ได้ เช่น ราคาสินค้า สภาพเศรษฐกิจ เป็นต้น
3.       Personal data
ข้อมูลประเภทนี้เป็นข้อมูลที่เกิดจากองค์กรที่มี Transaction Processing System ที่ไม่ดี เช่น ในการทำงานบางครั้งนั้น หากพนักงานต้องใช้ Microsoft Excel มาใช้ในการวิเคราะห์ข้อมูลด้วยตนเอง ก็จะทำให้ข้อมูลประเภทนั้นเรียกว่า Personal data
เมื่อเราเก็บรวบรวมข้อมูลจากแหล่งต่างๆแล้วเราก็จะนำข้อมูลเหล่านั้นมาเก็บไว้ที่ Database แต่เนื่องจากในองค์กรหนึ่งๆนั้นจะมี Database จำนวนมาก เช่น Supplier-Database, Customer-Database หากองค์กรต้องการจะวิเคราะห์ข้อมูลในขั้นสูงๆนั้นก็จำเป็นจะต้องมีการ Cross functional เพราะถ้าเราใช้แค่ Database ระดับ TPS ก็จะเป็นไปแค่ตาม Functional ขององค์กรเท่านั้น รวมถึงการที่ Format ของ Database แต่ละอันมีความแตกต่างกัน องค์กรจึงต้องสร้าง Data Warehouse ขึ้นมาเพื่อแก้ไขปัญหาเหล่านี้
หลังจากนั้นผู้ใช้ข้อมูลก็จะนำข้อมูลจาก Data Warehouse ที่ต้องการออกมาใช้เพื่อการวิเคราะห์ ซึ่งวงจรเหล่านี้จะนำไปสู่การตัดสินใจต่างๆ และเกิด Knowledge ขึ้นในองค์กร

Data Warehouse
                Data Warehouse เกิดจากการที่เรานำ Databaseต่างๆ มา Extract data โดยเลือกเฉพาะข้อมูลที่มีความจำเป็นและมีความเกี่ยวข้อง แล้วเราก็จะจัดการข้อมูลเหล่านั้นใหม่ จนทำให้เกิด Data Warehouse ขึ้นมา โดย Data Warehouse มีจุดประสงค์สำหรับ Analytical processing แต่อย่าไรก็ตามหากองค์กรที่ผู้บริหารสามารถตัดสินใจได้ด้วยตนเอง โดยใช้ความเชี่ยวชาญเฉพาะตน หรือประสบการณ์ส่วนบุคคล องค์กรนั้นก็ไม่จำเป็นต้องมี Data Warehouse ก็ได้ นอกจากนี้สำหรับองค์กรขนาดเล็ก ที่ไม่มี Database จำนวนมากเกิดไป หรือปีหนึ่งๆองค์กรต้องวิเคราะห์ข้อมูลเพียงไม่กี่ครั้ง องค์กรเหล่านี้ก็ไม่จำเป็นจะต้องมี Data Warehouse เนื่องจากอาจไม่คุ้มในการลงทุน