《资讯处理的基本概念.ppt》由会员分享,可在线阅读,更多相关《资讯处理的基本概念.ppt(35页珍藏版)》请在三一文库上搜索。
1、,2.1 資訊與數據的分別 2.6 數據處理 2.2 數據的收集及準備 2.7 資訊處理 2.3 錯誤來源 2.8 成批處理 2.4 數據有效性及數據校驗 2.9 實時處理 2.5 數據結構,2,課前討論,你會使用傳統的圖書館卡片目錄嗎? 你會使用學校的圖書館系統嗎?,數據經過處理,成為資訊,2.1 資訊與數據的分別,4,2.1 資訊與數據的分別,數據 收集到的、尚未經過組織的原始內容 本身沒有或只有很少的含義 資訊 經過了處理的數據,它具有一定的意義 有一定用途 一般而言,數據處理過程分為五個步驟: 1. 數據收集 2. 數據準備 3. 數據輸入 4. 數據處理 5. 資訊輸出,2.2 數據
2、的收集及準備,2.2.1 數據收集 2.2.2 數據準備,6,2.2 數據的收集及準備,2.2.1 數據收集 根據某一特定目的而展開的 所收集的原始數據一般稱為源文件 問卷、訪談和觀察 2.2.2 數據準備 把數據進行預前處理,使其格式適合接下去的處理步驟 工作:檢查數據的準確性和對數據進行分類。,2.3 錯誤來源,2.3.1 錯誤來源 2.3.2 無用輸入無用輸出,8,2.3.1 錯誤來源,因人手輸入而產生的錯誤: 數據源錯誤 轉錄錯誤 調換錯誤,9,2.3.2 無用輸入無用輸出,Garbage In Garbage Out, GIGO 為電腦工業中的流行術語 表示電腦輸出的質量依靠於它輸入
3、的質量,2.4 數據有效性 及數據校驗,2.4.1 數據有效性 data validation 2.4.2 模檢數 modulo check 2.4.3 檢查數位 check digit 2.4.4 數據校驗 data verification,11,2.4.1 數據有效性,數據有效性 (data validation) 將數據與一系列標準或數值進行比較,從而保證數據值的合理性 無效的數據通常都含有錯誤或偏差 通過數據有效性的檢查,可以找出源檔案中的錯誤,12,2.4.1 數據有效性,五個不同的數據檢查 域完整性的檢查 確認具備了所有必須的字段 字段長度的檢查 確認每項數據都具有正確字串的長度
4、 範圍檢查 確認數據值在預先確定的範圍內 格式檢查 確認數據的類型符合指定的格式 檢查數位 在實際數值之後加上一個檢查數位,13,2.4.2 模檢數,模檢數(modulo check) 算法的一種 用於檢查一個數字的有效性,14,2.4.3 檢查數位,檢查數位 (check digit) 使用十分廣泛 如國際標準圖書編號(ISBN)和身份證號碼中都用到了檢查數位 例:ISBN,15,2.4.4 數據校驗,數據校驗 (data verification) 確保數據在轉換過程中沒有差誤的環節 雙重輸入 讓一個操作員輸入同一數據兩次,由電腦系統對內容進行校驗 由兩個人獨立輸入 讓兩位不同的操作員依同
5、一來源的文件進行輸入,並貯存到不同的檔案裏,再進行校驗 前者比後者較為優勝,但是卻須要較多人手,16,2.4.4 數據校驗,雙重輸入和兩個人獨立輸入的比較,2.5 數據結構,2.5.1 分層式的數據結構 2.5.2 關鍵字段,18,2.5 數據結構,2.5.1 分層式的數據結構,數據庫 由一組相關數據檔案組成 數據表 數據分佈在數據表裏,表格中每一行的內容即是記錄 表格每一列的內容則是一條記錄,一條記錄則由多個字段(或欄)組成,19,2.5 數據結構,2.5.2 分層式的數據結構 關鍵字段(或主關鍵碼) 用來識別數據庫中的一個記錄 是唯一的, 沒有兩個記錄有同一個字段的值,2.6 數據處理,2
6、.6.1 排序 2.6.2 搜尋 2.6.3 合併,21,2.6 數據處理,2.6.1 排序 把數據以一順序的排列 排序鍵 利用進行排序的關鍵字段 記錄重新排序後,為了標明記錄在新序列中的位置,每一條記錄都將被賦一個新的記錄號,22,2.6 數據處理,2.6.2 搜尋 從大量的數據中找出所需要的資訊 順序搜尋 對一個數據庫中的所有記錄逐條由首至尾或由尾至首的進行核對 適用在非順序的數據中 二分搜尋 用於已排序的記錄中搜尋出某一特定記錄的方法 先找到記錄的中點處,即每次將待搜尋的記錄分半,只對一半的記錄進行搜尋,直到發現要查找的記錄,23,2.6 數據處理,2.6.3 合拼 把至少兩個或以上的數
7、據檔案產生出一個新檔案 若檔案中的記錄都是順序的,合併後出來所得的檔案都要為同一順序的方式,2.7 資訊處理,2.7.1 資訊重新整理 2.7.2 資訊轉換 2.7.3 資訊通訊 2.7.4 資訊傳輸,25,2.7 資訊處理,2.7.1 資訊重新整理 資訊可以以不同的結構演示 然而並非一建立的資訊結構就能滿足某一要求或需要 2.7.2 資訊轉換 資訊可以以不同的格式演示 將資訊從一種數碼檔格式轉換成另一種數碼檔格式 務必避免在轉換過程中丟失數據,26,2.7 資訊處理,2.7.3 資訊通訊 兩處地點進行資訊交換 它們都必須依同一個通訊傳輸的方式來進行資訊傳輸,已達致通訊的目的 TCP/IP 是
8、互聯網上的通訊協定。,27,2.7 資訊處理,2.7.4 資訊傳輸 由一處地點發送資訊至另一處地點 資訊傳輸的方式有很多種類 如:串行傳輸 和 並行傳輸 兩種,2.8 成批處理,2.8.1 成批處理照片大小 2.8.2 成批處理的特色,29,2.8.1 成批處理照片大小,一種操作模式: 程序連續處執行一組的工作,並且在進行執行過程時不會受到用戶的干預,30,2.8.2 成批處理的特色,數據處理和數據累積兩個階段會在不同時間進行。 因為會在一段時間內收集並累積數據,所以系統中的數據可能不會是最新的。 在進行處理過程時,因為沒有出現空閒時間,資源更有效地被使用。,2.9 實時處理,2.9.1 機票
9、訂購系統 2.9.2 實時處理的特色,32,2.9 實時處理,實時處理 一種操作模式: - 程序接收了要求後立即執行工作 - 程序的反應時間以微秒來作單位,33,2.9 實時處理,2.9.1 機票訂購系統 以實時處理的機票訂購系統:,34,2.9 實時處理,接收了工作後立即執行工作,反應時間十分短 系統中的數據是保持著最新的 因為系統要等候使用者的輸入,所以系統會有頗多的空閒時間,詞彙表,數據庫 database 數據表 table 記錄 record 字段;欄 field 關鍵字段 key field 排序 sort 順序搜尋 sequential search,二分搜尋 binary search 搜尋 search 合併 merge 串行 serial 並行 parallel 成批處理 batch processing 實時處理 real-time processing,
链接地址:https://www.31doc.com/p-4333375.html