ข้อมูล สารสนเทศ และความรู้
ความก้าวหน้าของเทคโนโลยีสารสนเทศในปัจจุบัน ทำให้ในแต่ละวันมีการผลิตข้อมูลขึ้นมาจำนวนมาก ข้อมูลบางส่วนจะถูกนำมาประมวลผลเพื่อนำไปประยุกต์ใช้ในด้านต่างๆ ตัวอย่างเช่นข้อมูลจากเว็บไซต์ที่มีจำนวนเพิ่มขึ้นอย่างรวดเร็วในแต่ละวัน ซึ่งสามารถใช้ประโยชน์จากข้อมูลเหล่านี้ได้เพียงค้นหาข้อความ รูปภาพ หรือวีดิทัศน์ ที่ตรงกับความสนใจเท่านั้น แต่ไม่สามารถนำข้อมูลเหล่านี้มาประมวลผลและแสดงความรู้ที่แฝงอยู่ได้อย่างมี ประสิทธิผล
ข้อมูล (data) คือ สื่งที่ใช้อธิบายคุณลักษณะของวัตถุ เหตุการณ์ กิจกรรม โดยบันทึกจาการสังเกต การทดลอง หรือการสำรวจด้วยการแทนรูปแบบใดรูปแบบหนึ่ง เช่น บันทึกไว้เป็นตัวเลข ข้อความ รูปภาพ และสัญลักษณ์
ตัวอย่างของข้อมูลต่างๆ ที่นักเรียนสามารถพบเห็นได้เป็นประจำ เช่น เกรดที่รักเรียนได้รับในแต่ละวิชา ราคาของสินค้าชนิดต่างๆ ในห้างสรรพสินค้า
รูปภาพและข้อความต่างๆ ที่ปรากฏในเว็บไซต์ ดังรูปที่ 2.1
เพื่อให้นักเรียนได้เห็นความแตกต่างของข้อมูลและสารสนเทศอย่างชัดเจนมากขึ้น จึงได้แสดงตัวอย่างของการเปลี่ยนข้อมูลมาเป็นสารสนเทศอย่างง่าย ไว้ในตัวอย่างที่ 2.1
ตัวอย่างที่ 2.1 ถ้าเราต้องการทราบการเปลี่ยนแปลงหรือการเจริญเติบโตของต้นถั่วเพื่อเฟรียบ เทียบส่วนสูงกันว่ามีการเปลี่ยนแปลงอย่างไรดังรูปที่ 2.2
จากตัวอย่างข้างต้น จะเห็นได้ว่าการสร้างสารสนเทศ ซึ่งในที่นี้คือ ส่วนสูงเฉลี่ยของนักเรียนในชั้นมัธยมศึกษาปีที่ 1 จะสามารถถูกนำไปใช้เพื่อวิเคราะห์และตอบคำถามว่า ส่วนสูงของนักเรียนมีการเปลี่ยนแปลงอย่าไงรตลอด 20 ปีที่ผ่านมาซึ่งสารสนเทศเหล่านี้จะถูกนำไปใช้เพื่อสนับสนุนการตัดสินใจอื่นๆ เช่น การตัดสินใจด้านโภชนาการ หรือการจัดหลักสูตรวิชาพลานามัย เพื่อให้เหมาะสมกับนักเรียนในปัจจุบัน
ความรู้ (knowledge) เป็นคำที่มีความหมายกว้าง และใช้กันโดยทั่วไป ในด้านวิทยาการคอมพิวเตอร์หรือวิศวกรรมคอมพิวเตอร์กล่าวถึงความรู้ไว้ในหลาย แง่มุม แต่ความหมายในแง่มุมหนึ่งที่สอดคล้องกับข้อมูลและสารสนเทศ ความรู้ คือ สิ่งที่ประกอบด้วยข้อมูลและสารสนเทศที่ถูกจัดรูปแบบและประมวลผลเพื่อนำไป ประยุกต์ใช้ในปัญหาที่ต้องการนำข้อมูลและสารสนเทศเหล่านี้ไปแก้ไข
นอกจากนี้ยังมีนิยามของความรู้อีกด้านหนึ่งที่เกี่ยวข้องกับเรื่องของ ข้อมูลและสารสนเทศคือ ความรู้ที่แฝงอยู่ในข้อมูล เป็นสื่งที่สามารถสกัดจากสารสนเทศที่มีรูปแบบน่าสนใจ เป็นจริงสำหรับข้อมูลใหม่หรือข้อมูลที่ไม่เคยเห็นมาก่อน เป็นรูปแบบใหม่ที่มนุษย์ไม่เคยเห็นกันมาก่อน ซึ่งผลลัพธ์สุดท้ายจาการวิเคราะห์สารสนเทศจะได้เป็นความรู้ที่เป้นประโยชน์ต่อผู้ใช้ได้
เราเรียกกระบวนการที่สามารถสกัดความรู้จากข้อมูลที่ถูกเก็บรวบรวมไว้เป็น อย่างดีในฐานข้อมูลว่า การค้นพบความรู้ในฐานข้อมูล (knowledge discovery in databases) ดังรูปที่ 2.4 ซึ่งตัวอย่างของการค้นพบความรู้นี้ แสดงไว้ในตัวอย่างที่ 2.2
ตัวอย่างที่ 2.2 สมมติว่าเราไม่เคยมีความรู้มาก่อนเลยว่าเพราะเหตุใดนักเรียนบางคน จึงสูงกว่านักเรียนคนอื่น เราสามารถนำส่วนสูงของนักเรียนแต่ละคนมาจับคู่กับคุณสมบัติอื่นๆ เช่น ลักษณะนิสับการรับประทานอาหาร (รับประทานอาหารที่มีประโยชน์เป็นประจำหรือไม่)
และความถี่ในการออกกำลังกาย ( ทุกวัน สัปดาห์ละ 3 ครั้ง สัปดาห์ละครั้ง เดือนละครั้ง หรือน้อยมาก)
เมื่อเราใช้กระบวนการค้นพบความรู้ในบานข้อมูลชุดนี้ ความรู้ที่เราอาจจะพบได้จากข้อมูล ได้แก่ รูปแบบความสัมพันธ์บางอย่าง เช่น
1. นักเรียนที่ออกกำลังกายทุกวัน และรับประทานอาหารที่เป็นประโยชน์เป็นประจำ จะมีส่วนสูงสูงกว่านักเรียนที่ออกกำลังกายวันเว้นวัน แต่ไม่ได้รับประทานอาหารที่เป็นประโยชน์เป็นประจำ
2. นักเรียนที่ออกกำลังกายน้อยมาก และไม่รับประทานอาหารที่เป็นประโยชน์เป็นประจำ จะมีส่วนสูงน้อยที่สุดในห้อง
ในการบริหารองค์กร สิ่งหนึ่งที่เกิดขึ้นแต่ไม่สามารถประเมินคุณค่าเป็นตัวเงินได้ คือ ความรู้ที่ได้จากการปฎิบัติงาน เนื่องจากในการทำงาน การแก้ปัญหา การแสวงหาความรู้ การนำความรู้มาปรับใช้ โดยพนักงานในระดับต่างๆ เกิดขึ้นอยู่ตลิดเวลาในการทำงาน พนักงานที่ปฎิบัติงานหนึ่งคนจะต้องใช้ความรู้และทักษะเฉพาะอย่าง เพื่อทำงานให้ลุล่วงไปได้ ซึ่งการจำทำให้พนักงานหนึ่งคนสามารถปฏิบัติงานได้อย่างราบรื่นนั้น จะต้องใช้การอบรมเพื่อสร้างความรู้รวมถึงทักษะให้กับพนักงานเหล่านี้ ซึ่งความรู้ที่ถ่ายทอดให้แก่พนักงานนี้ จัดว่าเป้นทุนทางปัญญา (intellectual capital) ซึ่งเป็นสื่งที่คุณค่าอย่างสูงกับองค์กร เพราะความรู้บางอย่างต้องใช้งบประมาณและเวลาในการสร้างขึ้น ทำอย่างไรจึงจะมามารถจัดการความรู้ในองค์กรเหล่านี้ให้เกิดประสิทธิภาพสูง สุด ตัวอย่างการจัดการความรู้ในองค์กร ดังรูปที่ 2.5
ระบบสารสนเทศเพื่อการจัดการความรู้ สามารถช่วยองค์กรในการจัดการความรู้เหล่านี้ได้โดยระบบนี้จะทำงานแตกต่างกัน ไปตามจุดมุ่งหมายขององค์กร ซึ่งผู้ใช้ในองค์กรที่อาจประกอบด้วยพนักงานทั่วไป ผู้บริหาร หรือบุคคลภายนอก จะเป็นผู้สร้างสารสนเทศเพื่อเก็บไว้ในระบบนี้ โดยระบบจะต้องสามารถจัดหมวดหมู่ ค้นหา รวมถึงกระจายสารสนเทศเหล่านี้ให้กับผู้ใช้คนอื่นเพื่อให้ผู้ใช้แต่ละคน สามารถนำสารสนเทศไปใช้ได้ตามสิทธิ์ของตนเอง ตัวอย่างระบบสารสนเทศเพื่อการจัดการความรู้ ดังรูปที่ 2.6
รูปที่ 2.6 ตัวอย่างระบบสารสนเทศเพื่อการจัดการความรู้ (http://202.44.68.33/files/u9222/2_0.jpg)
นอกจากนี้ยังมีศาสตร์ที่เกี่ยวข้องกับการจัดการความรู้ที่น่าสนใจอีกด้าน หนึ่ง คือ ความฉลาดร่วม (collective intelligence) ซึ่งเป็นการสร้างความฉลาดหรือสร้างความรู้ร่วมกันระหว่างผู้ใช้ ตัวอย่างของการสร้างความรู้ในลักษณะนี้เช่น วิกิพีเดีย (Wikipedia) ซึ่งผู้ใช้แต่ละคนสามารถเพิ่มเติม แก้ไข ข้อมูลร่วมกันได้ โดยผู้ใช้คนอื่นๆ ที่ไม่ได้มีส่วนร่วมในการเพิ่มเติมหรือแก้ไขข้อมูล ก็สามารถเข้าถึงและใช้ข้อมูลหรือความรู้เหล่านั้นได้ เป็นต้น ตัวอย่างการสร้างความรู้ร่วมกันของวิกิพีเดีย ดังรูปที่ 2.7
2.3 ลักษณะของข้อมูลที่ดี
มีคำกล่าวเกี่ยวกับการประมวลผลข้อมูลไว้อย่างน่าฟังว่า ถ้าข้อมูลเข้าเป็นขยะ สื่งทีออกมาก็จะเป็นขยะด้วย (Garbage In , Garbage Out) ซึ่งหมายความว่า ถ้าข้อมูลที่นำไปประมวลผลเป็นข้อมูลที่ด้อยคุณภาพ ผลลัพธ์ที่ออกมาก็ย่อมด้อยคุณภาพไปด้วย ดังนั้นเราควรจะตระหนักถึงความสำคัญของการเก็บข้อมูล รวมถึงการประมวลผลข้อมูลเบื้องต้นด้วย
1. ความถูกต้องของข้อมูล เป็นลักษณะสำคัญยิ่งของข้อมูล ถ้าข้อมูลไม่ถูกต้องแล้ว เราจะไม่สามารถได้ผลลัพธ์ที่ถูกต้องได้เลย ซึ่งประเด็นนี้เป็นเรื่องสำคัญที่เกิดขึ้นโดยเฉพาะอย่างยิ่งกับข้อมูลที่มี ขนาดใหญ่ และไม่มีการตรวจสอบ เช่น ข้อมูลในโลกอินเทอร์เน็ต ซึ่งจำเป็นต้องได้รับการตรวจสอบก่อนนำมาใช้เสมอ
นอกจากนี้ข้อมูลบางประเภท เช่น ข้อมูลเสียงที่เก็บจากไมโครโฟน ดังรูปที่ 2.8 อาจมีปัญหาเกี่ยวกับสัญญาณเสียงรบกวนเกิดขึ้นดังนั้นข้อมูลประเภทนี้ จึงต้องได้รับการปรับปรุงคุณภาพหรือเรียกว่า กระบวนการลดสัญญาณรบกวน จึงจะสามารถนำมาใช้งานได้
มีคำกล่าวเกี่ยวกับการประมวลผลข้อมูลไว้อย่างน่าฟังว่า ถ้าข้อมูลเข้าเป็นขยะ สื่งทีออกมาก็จะเป็นขยะด้วย (Garbage In , Garbage Out) ซึ่งหมายความว่า ถ้าข้อมูลที่นำไปประมวลผลเป็นข้อมูลที่ด้อยคุณภาพ ผลลัพธ์ที่ออกมาก็ย่อมด้อยคุณภาพไปด้วย ดังนั้นเราควรจะตระหนักถึงความสำคัญของการเก็บข้อมูล รวมถึงการประมวลผลข้อมูลเบื้องต้นด้วย
1. ความถูกต้องของข้อมูล เป็นลักษณะสำคัญยิ่งของข้อมูล ถ้าข้อมูลไม่ถูกต้องแล้ว เราจะไม่สามารถได้ผลลัพธ์ที่ถูกต้องได้เลย ซึ่งประเด็นนี้เป็นเรื่องสำคัญที่เกิดขึ้นโดยเฉพาะอย่างยิ่งกับข้อมูลที่มี ขนาดใหญ่ และไม่มีการตรวจสอบ เช่น ข้อมูลในโลกอินเทอร์เน็ต ซึ่งจำเป็นต้องได้รับการตรวจสอบก่อนนำมาใช้เสมอ
นอกจากนี้ข้อมูลบางประเภท เช่น ข้อมูลเสียงที่เก็บจากไมโครโฟน ดังรูปที่ 2.8 อาจมีปัญหาเกี่ยวกับสัญญาณเสียงรบกวนเกิดขึ้นดังนั้นข้อมูลประเภทนี้ จึงต้องได้รับการปรับปรุงคุณภาพหรือเรียกว่า กระบวนการลดสัญญาณรบกวน จึงจะสามารถนำมาใช้งานได้
สำหรับข้อมูลที่ได้บการบันทึกด้วยมนุษย์โดยมากมักต้องผ่านการตรวจสอบก่อน เสมอ ซึ่งอาจตรวจสอบโดยมนุษย์ หรือตรวจสอบโดยระบบ ตัวอย่างเช่น ข้อมูลที่มีความสำคัญอาจต้องป้อนสองครั้ง เพื่อป้องกันความผิดพลาดซึ่งนักเรียนสามารถเห็นตัวอย่างของข้อมูลเหล่านี้ ได้จากการป้อนรหัสผ่านเวลาลงทะเบียนตามเว็บไซต์ต่างๆ ที่นีกเรียนต้องป้อนรหัสหรืออีเมลสองครั้ง เพื่อป้องกันข้อผิดพลาด ดังรูปที่ 2.9 นอกจากนี้ข้อมูลที่เป็นรหัสตัวเลขสำคัญ มักจะมีตัวเลขซึ่งเป็นหลักตรวจสอบแฝงไว้เสมอ เช่น ข้อมูลหมายเลขบัตรเครดิต 16 หลัก เมื่อนำมาผ่านกระบวนการประมวลผล จะสามารถตรวจสอบได้ว่า หมายเลขบัตรเครดิตนั้นถูกต้องหรือไม่ เป็นต้น
รูปที่ 2.9 แสดงหน้าจอของเว็บไซต์ที่ต้องป้อนข้อมูลสองครั้ง เพื่อป้องกันความผิดพลาด (จากหน้าต่าง http://www.imeem.com)
2. ความสมบูรณ์ครบถ้วนในการนำไปใช้งาน ข้อมูลบางประเภทหากไม่ครบถ้วน จัดเป็นข้อมูลที่ด้อยคุณภาพได้เช่นกัน เช่น ข้อมูลประวัติคนไข้ หากไม่มีหมูเลือดของคนไข้ จะไม่สามารถใช้ได้ในกรณีที่ผู้ร้องขอข้อมูลต้องการข้อมูลหมู่เลือดของคนไข้ หรือข้อมูลที่อยู่ของลูกค้า ที่กรอกผ่านแบบฟอร์ม ถ้ามีชื่อและนามสกุลโดยไม่มีข้อมูลบ้านเลขที่ ถนน แขวง/ตำบล เขต/หรือจังหวัด ข้อมูลเหล่านั้นก็ไม่สามารถนำมาใช้ได้เช่นกัน ตัวอย่างข้อมูลที่ไม่ครบถ้วน ดังรูปที่ 2.10
รูปที่ 2.10 ตัวอย่างข้อมูลที่ไม่ครบถ้วน (http://web.pointasia.com/th/forum/upload/userFile/114.jpg)
ข้อมูลการติดตามตำแหน่งของรถยนต์ด้วยระบบจีพีเอส ดังแสดงในรูปที่ 2.11 สำหรับบริษัทที่ต้องทำงานติดตามรถยนต์ ข้อมูลตำแหน่งรถยนต์ จะต้องได้รับการปรับให้เป็นจริงตลิดเวลา หากข้อมูลนั้นปรับทุกๆหนึ่งชั่วโมง จะไม่มีประโยชน์ในการติดตามตำแหน่งของรถยนต์ ดังนั้นในเรื่องความถูกต้องตามเวลาของข้อมูล จึงเป็นเรื่องสำคัญประการหนึ่งที่ต้องนำมาพิจารณาเมื่อต้องมีการจัดเก็บข้อมูลหรือประมวลผลข้อมูล
รูปที่ 2.11 ระบบติดตามรถยนต์ด้วยจีพีเอส (http://www.nectec.or.th/rd/electronics/be205-45/images/Resize%20of%2001.jpg)
3. ความถูกต้องตามเวลา ในบางกรณีข้อมูลผูกอยู่กับเงื่อนไขของเวลา ซึ่งถ้าผิดจากเงื่อนไขของเวลาไปแล้ว ข้อมูลนั้นอาจลดคุณภาพลงไป หรือแม้กระทั่งไม่สามารถใช้ได้ เช่น ข้อมูลการให้ยาของคนไข้ในโรงพยาบาล ดังรูปที่ 2.12 ในทางการแพทย์แล้ว ข้อมูลนี้จะต้องถูกใส่เข้าไปในฐานข้อมูลที่คนไข้ได้รับยาเพื่อให้แพทย์คน อื่นๆ ได้ทราบว่า คนไข้ได้รับยาชนิดนี้เข้าไปแล้ว แต่ข้แมูลเรื่องการให้ยาของคนไข้นี้ อาจไม่จำเป็นต้องได้รับการปรับทันที สำหรับแผนกการเงิน เพราะแผนกการเงินจะคิดเงินก็ต่อเมื่อญาติคนไข้มาตรวจสอบ หรือคนไข้กำลังออกจากโรงพยาบาล
รูปที่ 2.12 ตัวอย่างข้อมูลการให้ยาคนไข้ในโรงพยาบาล (http://www.talkystory.com/imagelib/www.talkystory.com/082009/4ecdc43b6e28249.jpg)
4. ความสอดคล้องกันของข้อมูล ในกรณที่ข้อมูลมาจากหลายแหล่ง จะเกิดปัญหาขค้นในเรื่องของความสอดคล้องกันของข้อมูล เช่น ในบริษัทแห่งหนึ่งซึ่งเก็บข้อมูลที่อยู่ลูกค้า หากต้องการนำข้อมูลไปควบรวมกับบริษัทอีกแห่งหนึ่งซึ่งมีข้อมูลของลูกค้าอยู่ เช่นกัน แต่ข้อมูลในการจัดส่งเอกสารของบริษัทแห่งแรก เป็นที่อยุ่ที่พักอาศัยของลูกค้า ในขณะที่ข้อมูลในบริษัทที่สองเป็นที่อยู่ของสถานที่ทำงานลูกค้า ข้อมูลจากทั้งสองบริษัทนี้เป็นข้อมูลที่ถูกต้องสอดคล้องตามเวลาทั้งคู่ แต่ถ้าต้องการเก็ยข้อมูลที่อยู่ลูกค้าเพียงที่อยู่เดียว ก็จะเกิดปัญหาขึ้นได้ ตัวอย่างของการไม่สอดคล้องกันของข้อมูล ดังรูปที่ 2.13
รูปที่ 2.13 ตัวอย่างของการไม่สอดคล้องกันของข้อมูล (http://www.oknation.net/blog/home/blog_data/532/34532/images/Econ/pfund/Insider.jpg)
2.4 การจัดเก็บข้อมูล
เมื่อเห็นความสำคัญของข้อมูลแล้ว ทำอย่างไรจึงจะเก็บรักษาข้อมูลเหล่านั้นให้คงอยู่ รวมถึงทำให้สามารถประมวลผลข้อมูลนั้นได้อย่างรวดเร็วโดยมากและจะรวมอยู่ใน ระบบฐานข้อมูล ซึ่งนำมาใช้ในการจัดเก็บการเข้าถึงและการประมวลผล ข้อดีในการนำฐานข้อมูลเหล่านี้ไปใช้ในองค์กรหรือหน่วยงาน เช่น
- การจัดเก็บอย่างมีประสิทธิภาพ สามารถลดภาระการเก็บเอกสารที่เป้นกระดาษได้ รวมถึงการทำซ้ำเพื่อสำรองข้อมูล สามารถทำได้สะดวกและรวดเร็ว
- การตอบสนองต่อความต้องการได้อย่างรวดเร็ว เช่น ข้อมูลประวัติการบำรุงรักษารถยนต์และข้อมูลประวัติคนไข้ ผู้ใช้ที่ต้องการนำข้อมูลเหล่านี้ไปใช้งาน สามารถเข้าถึงระบบฐานข้อมูลและนำข้อมูลที่ต้องการไปใช้ได้
- การจำกัดสิทธิ์ในการเข้าถึงข้อมูลให้แก่ผู้ใช้ในแต่ละระดับขององค์กร เช่น ผู้บริหารสามารถเข้าถึงข้อมูลของทุกหน่วยงานได้ แต่ผู้ใช้ทั่วไปในแผนกการเงิน ไม่สามารถเข้าถึงข้อมูลประวิติของฝ่ายบุคคลได้ เป็นต้น
2.4.1 ลำดับชั้นของข้อมูลในฐานข้อมูล ก่อนจะกล่าวถึงลำดับชั้นของข้อมูลในฐานข้อมูลสื่งแรกที่ต้องกล่าวถึงก่อน คือ ลำดับชั้นล่างสุดของการแทนข้อมูล นั่นคือ การแทนข้อมูลด้วยตัวเลขฐานสอง ซึ่งประกอบด้วยตัวเลขสองตัว คือ ' 0 ' และ '1' ในทางคอมพิวเตอร์ จะเรียกตัวเลขฐานสองหนึ่งหลักนี้ว่า 1 บิต (bit) ซึ่งถือว่าเป็นหน่วยเล็กที่สุดของข้อมูล และหากนำบิตมาต่อกันจำนวน 8 บิต จะเรียกว่า 1 ไบต์ (byte) ตัวอย่างทารแทนข้อมูลทางคอมพิวเตอร์ ดังรูปที่ 2.15
รูปที่ 2.15 ตัวอย่างการแทนข้อมูลทางคอมพิวเตอร์ (http://www.doteenee.com/help/pichelp/help00088.jpg)
1. เขตข้อมูล (field) เมื่อนำข้อมูลระดับบิตมาเรียงต่อกันเพื่อแทนข้อมูลใดๆ ที่ต้องการเก็บในฐานข้อมูล เราจะจัดข้อมูลที่เป็นบิตนี้มารวมกันเพื่อแทนความหมายบางอย่าง หน่วยย่อยที่สุดที่มีความหมายในฐานข้อมูลนี้เรียกว่า เขตข้อมูล
โดยเขตข้อมูลอาจแทนข้อมูลดังตัวอย่างต่อไปนี้
- จำนวนเต็ม (interger) คอมพิวเตอร์ส่วนใหญ่จะเก็บตัวเลขขนาด 32 บิต ซึ่งขนาดของตัวเลขนี้อาจเปลี่ยนแปลงไปตามเทคโนโลยีของเครื่องคอมพิวเตอร์ ตัวเลขฐานสองขนาด 32 บิต สามารถแทนตัวเลขจำนวนเต็มได้ตั้งแต่ -2,147,483,
648 ถึง 2,147,483,647 แต่ถ้าเป็นเขตข้อมูลที่ระบุไว้ว่า เป็นตัวเลขจำนวนเต็มไม่ระบุเครื่องหมาย (unsigned integer) เท่านั้นจะสามารถแทนตัวเลขจำนวนเต็มได้ตั้งแต่ 0 ถึง 4,294,967,295
- จำนวนทศนิยม (decimal number) ใรคอมพิวเตอร์ จะเก็บตัวเลขทศนิยม โดยใช้ระบบโฟลททิงพอยต์ (floating piont) ซึ่งการเก็บในลักษณะนี้ ไม่มีการกำหนดตำแหน่งตายตัวสำหรับตำแน่งของจุด โดยทั่วไปการเก็บข้อมูลตัวเลขจะมีสองขนาด คือ 32 บิต และ 64 บิต
- ข้อความ (text) ในการแทนข้อความนั้น จะต้องเปลี่ยนข้อความให้เป็นรหัสซึ่งใช้แทนตัวอักขระแต่ละตัวเสียก่อน ตามมาตรฐานโดยทั่วไปจะใช้เป็นรหัสแอสกี (ASCII code) ซึ่งต่อมามีการใช้รหัสแบบยูนิโคด (Unicode) ที่สามารถแทนภาษได้หลายภาษามากกว่ารหัสแอสกี
ความยาวของเขตข้อมูลประเภทนี้ ขึ้นอยู่กับจำนวนตัวอักขระในข้อความ
- วันเวลา (date/time) ข้อมูลที่เป็นวันเวลา เช่น วันที่เริ่มใช้งาน วันลงทะเบียน และเวลาที่ซื้อสินค้า มีความแตกต่างจากข้อมูลประเภทอื่น ดังนั้นจึงต้องมีชนิดของข้อมูลเป็นวันเวลา เพื่อรองรับเขตข้อมูลที่ต้องการเก็บข้อมูลเป็นวันเวลา
- ไฟล์ (file) เขตข้อมูลบางประเภทใช้เก็บไฟล์รูปภาพหรือไฟล์อื่นๆซึ่งเขตข้อมูลประเภทนี้จะ เป็นเขตข้อมูลขนาดใหญ่ โดยปกติแล้วจะมีความยาวมากกว่าเขตข้อมูลประเภทอื่นๆ โดยเขตข้อมูลนี้จะเก็บข้อมูลในลักษณะเป็นบิตเรียงต่อกัน
2. ระเบียน (record) คือ กลุ่มของเขตข้อมูลที่มีความสัมพันธ์กัน โดยเขตข้อมูลแต่ละส่วนอาจจะเป็นข้อมูลต่างชนิดกัน ระเบียนแต่ละระเบียนจะประกอบด้วยโครงสร้างเขตข้อมูลที่เหมือนกัน ตัวอย่างระเบียน ดังรูปที่ 2.16
3. ตาราง (table) คือ กลุ่มของระเบียน ซึ่งเขตข้อมูลในแต่ละระเบียนจะเก็บข้อมูลที่มีความสัมพันธ์กัน ในตารางจะเก็บข้อมูลหลายๆระเบียน แต่ละระเบียนจะมีโครงสร้างเหมือนกันในตาราง นอกจากจะเก็บข้อมูลหลายระเบียนแล้ว ยังสามารถอ้างถีงระเบียนแต่ละระเบียนได้อีกด้วย ตัวอย่างตารางข้อมูลนักเรียน7
4. ฐานข้อมูล(database)เป็นที่รวมของตารางหลายๆ ตารางเข้าไว้ด้วยกัน ตารางแต่ละตารางจะมีความสัมพันธ์กันโดยใช้เขตข้อมูลที่เก็บข้อมูลซึ่งเหมือน กันเป็นตัวเชื่อมโยงระหว่างกัน บางตารางอาจเป็นตารางที่เก็บข้อมูลไว้เฉพาะของตนเองโดยไม่เกี่ยวข้องกับ ตารางอื่น ในขณะที่บางตาราง อาจต้องเชื่อมโยงกับเขตข้อมูลของตารางอื่น