Search This Blog

Wednesday, January 19, 2011

AI613#9 : Data Warehouse Process and Business Intelligence ][5202113089][

Data Warehouse Process มีดังนี้

  ข้อมูลจาก External data & Operation data  >> ถูกนำมาทำ Data Staging ( Extract, Clean, Transform, Load ) เพื่อให้ได้ข้อมูลเฉพาะส่วนที่จำเป็นต่อการตัดสินใจ >> Data Warehouse Business Subject >> อยู่ในรูปของ Business Views โดยนำขึ้นใช้งานผ่าน web ได้ >>Information Catalog >>นำมาสร้างเป็น Business Information โดย ข้อมูลจาก  External data & Operation data จะถูกนำมาสร้าง Metadata

Metadata คือ ข้อมูลของข้อมูล โดยให้รายละเอียดว่า ข้อมูลนั้นมีแหล่งที่มาจากไหน มีการ summarized อย่างไร


Data Mart
  เป็น small scaled-down ของ data warehouse ซึ่่งออกแบบมาให้เหมาะกับการใช้งานเฉพาะหน่วยงาน อย่างไรก็ตาม data mart ไม่ได้หมายถึงการย่อขนาด ของ data warehouse แต่มีการตัดแบ่งข้อมูลออกมาตามมุมมองของผู้ใช้ มีการ copy/replicate ข้อมูลมาจากฐานข้อมูลของ enterprise เพื่อมาสร้าง data mart ของหน่วยงานตนเอง

  data mart อาจแบ่งได้เป็น 2 ประเภท ได้แก่

1.  Replicated (dependent) : คือการที่องค์กรมี Enterprise data warehouse อยู่แล้ว จึงทำการ replicated บางส่วนของ data warehouse มาเป็น small data mart สำหรับการใช้งานแต่ละหน่วยงาน

2. Stand-alone : เกิดจากการที่ องค์กรยังไม่พร้อมที่จะมี Enterprise data warehouse จึงมีการทำ data mart แยกในแต่ละหน่วยงาน

ผลดีของ data mart คือ ช่วยลดเวลาและค่าใช้จ่าย หน่วยงานสามารถควบคุมและตัดสินใจได้เองโดยไม่ต้องรอส่วนกลาง

Data Cube
    - Multidimensional databases ( หรือ อาจเรียกว่า OLAP ) เป็นการจัดเก็บข้อมูลแบบพิเศษ ซึ่งมีการจัดข้อมูลตาล dimensions ต่างๆ เช่น ตามลักษณะทางภูมิศาสตร์, สายผลิตภัณฑ์, salesperson, time ซึ่งข้อมูลที่ถูกจัดเก็บในฐานข้อมูลนี้เรียกว่า data cube จุดประสงค์ก็เพื่อสร้างของข้อมูลรูปแบบพิเศษเพื่อให้วิเคราะห์ข้อมูลได้เร็วขึ้น โดยนำข้อมูลที่มีหลาย dimensions มารวมกัน

    - ตัวอย่างเช่น ข้อมูลรายละเอียดเกี่ยวกับ ปริมาณของสินค้าที่ขายได้ โดยแบ่งตาม location ของร้านค้า และอยู่ในช่วงเวลาที่กำหนด

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++


Business Intelligence (BI)
  เป็นกลุ่มของเทคโนโลยีสารสนเทศ ที่ใช้ในการรวบรวม จัดเก็บ เตรียมข้อมูล วิเคราะห์ข้อมูล และนำเสนอข้อมูล โดยกระบวนการของ BI จะเปลี่ยน data ---> information เพื่อให้สำหรับการตัดสินใจและนำไป
ใช้ได้จริง

BI Architecture
  - Data extraction and Integration : ทำการรวบรวมข้อมูลจากแหล่งต่างๆ ไม่ว่าจะเป็น OLAP, ERP, CRM, SCM, legacy & local data stores, the Web และมีการใช้ ETL (extract, transformation, load) ในการทำ data integration

  - Data mining, query and analysis tools :  เป็นขั้นตอนการวิเคราะห์ข้อมูลด้วยเครื่องมือต่างๆ

 - Enterprise Reporting Systems : การนำเสนอข้อมูลมายัง users โดยผ่าน reporting tools ต่างๆ และ operational application เช่น Enterprise reporting , Enterprise search, scorecards, dash boards, visualization tools

Business Performance Management
  การทำ BPM จะช่วยให้การเปรียบเทียบเป้าหมายกับคุณภาพของงานที่ทำได้ เป็นไปอย่างสะดวกและรวดเร็ว และมีส่วนสำคัญสำหรับการบริหารงานเชิงกลยุทธ์ โดยการทำ BPM จะมีประสิทธิภาพได้ดีเพียงใด ขึ้นอยู่กับ BI analysis reporting, queries, dashboards& scorecards

OLTP ; Online Analytical Processing
   เป็นการประเมินผลเชิงออนไลน์ เป็น software ที่ทำให้ผู้บริหารสามารถเข้าถึง และมองลึกเข้าไปในตัวข้อมูล อย่างรวดเร็ว และสามารถดึงข้อมูลออกมาได้ในหลายๆมุมมอง

OLTP Activities
  - Generating and answering queries
  - Requesting as hoc reports and graphs
  - Conducting statistical and other analyses
  - Visual presentation
  - May include multidimensional analysis ans presentations, executive or enterprise IS, data mining
  - Provide capabilities to modeling analysis and visualization

Data mining
   เป็นกระบวนการในการ extract ข้อมูลจากฐานข้อมูลขนาดใหญ่ เพื่อค้นหารูปแบบและความสัมพันธ์ของข้อมูลดังกล่าว เพื่อให้ได้ข้อมูลที่สำคัญและเป็นประโยชน์ต่อการตัดสินใจ

Yield from Data mining
 - Clustering : ได้รูปแบบของกลุ่มข้อมูล เกิดจากความสัมพันธ์ของข้อมูล
 - Classification : เกิดจากการจัดกลุ่มของผู้ใช้เอง ที่มี assumption ถึงความสัมพันธ์ของข้อมูล
 - Association : เกิดจากผลสืบเนื่องของ 2 เหตุการณ์ที่เกิดขึ้น มีความเชื่อมโยงเกี่ยวข้องกัน
 - Sequence discovery : พบรูปแบบหรือลำดับเหตุการณ์ที่มักจะเกิดขึ้น
 - Prediction : อาจพบข้อมูลที่มี trends หรือ pattern ที่ทำให้คาดการณ์สิ่งที่จะเกิดขึ้นได้

Advantage and Disadvantages of Data mining
  แม้การทำ data mining จะให้ผลลัพธ์เป็นข้อมูลที่มีประโยชน์ต่อการตัดสินใจ แต่การเตรียมข้อมูล ตลอดจนการอ่านผล และแปลผล สามารถทำได้ยาก จำเป็นต้องอาศัยผู้เชี่ยวชาญในการแปลและตีความ โดยวิธีทำก็อาจมีความยุ่งยากซับซ้อน

Text Mining
  เป็น Application ของ data mining อย่างหนึ่ง ในการค้นหาและจัดรูปแบบ text files ทั้งนี้ การทำ text mining มักทำกับข้อความจำนวนมาก เพื่อหาความสัมพันธ์ที่มีอยู่ของข้อความต่างๆ โดยอาจจะอาศัยหลักการทาง สถิติ หรือการเรียนรู้และการจดจำของเครื่อง

Applications of text mining
  - Automatic detection of email spam or phishing through analysis of the document content
  - Automatic procession of messages or e-mails to route a message to the most appropriate party to process that message
  - Analysis of warranty claims, help desk calls/reports and so on to identify the most common problems and relevant responses

web mining ถือเป็น text mining รูปแบบพิเศษอีกรูปแบบหนึ่งที่การ mining เกิดขึ้นบน website ซึ่งจะช่วยเพิ่มความสามารถให้กับ website เช่น แนะนำ links ที่เกี่ยวข้อง หรือ แนะนำ new productsได้

No comments:

Post a Comment