02之01
刪除Excel中的重複數據記錄
電子表格程序(如Excel)經常用作數據庫,用於部件庫存,銷售記錄和郵件列表等。
Excel中的數據庫由通常組織成稱為記錄的數據行的數據表組成。
在記錄中,行中每個單元格或字段中的數據都是相關的,例如公司的名稱,地址和電話號碼。
隨著數據庫規模的擴大,常見問題是重複記錄或數據行。
如果發生以下情況,可能會發生此重複:
- 整個記錄不止一次輸入到數據庫中,導致兩個或更多相同的記錄
- 多個記錄具有一個或多個包含相同數據的字段(如名稱和地址)。
無論哪種方式,重複記錄都會導致一系列問題 - 例如,當郵件合併中使用數據庫信息時,將多份文檔郵寄給同一個人 - 因此,最好在常規掃描和刪除重複記錄基礎。
雖然很容易在上圖中的小樣本中挑出重複記錄,但數據表可能很容易包含數百個(如果不是數千個)記錄,因此很難挑出重複的記錄 - 特別是部分匹配的記錄。
為了更容易地完成此任務,Excel有一個內置的數據工具,稱為Remove Duplicates ,它可以用來查找和刪除相同以及部分匹配的記錄,這並不奇怪。
但是, 除去重複工具的設計方式,相同和部分匹配的記錄必須分開處理。
這是因為“ 刪除重複項” 對話框顯示所選數據表的字段名稱,並選擇要在匹配記錄搜索中包含哪些字段:
- 對於相同的記錄,搜索所有字段 - 在所有列或字段名稱旁邊留下複選標記;
- 對於部分匹配的記錄 - 僅在要匹配的字段旁留下複選標記。
字段名稱與列字母
如前所述,Remove Duplicates工具由一個對話框組成,您可以通過勾選所需的字段或列名稱來選擇要搜索的匹配字段。
對話框中顯示的信息(字段名稱或列名稱)取決於數據是否在數據表頂部包含一行標題(或標題 ),如上圖所示。
如果確實如此 - 請確保對話框右側的選項 - 我的數據具有標題 - 將被選中,Excel將在該行中顯示名稱作為對話框中的字段名稱。
如果您的數據沒有標題行,則對話框將在對話框中為所選數據范圍顯示適當的列字母。
連續的數據范圍
為使刪除重複工具正常工作,數據表必須是連續的數據范圍 - 也就是說,它不能有任何空的行,列,並且如果可能的話,表中沒有空單元 。
在數據表中沒有空格是一種很好的做法,當涉及到數據管理時,而不僅僅是搜索重複數據時。 Excel的其他數據工具(如排序和過濾)在數據表是連續的數據范圍時效果最佳。
刪除重複的數據記錄示例
在上面的圖片中,數據表包含了A. Thompson的兩個相同的記錄和R. Holt的兩個部分匹配記錄 - 所有字段都匹配,除了學號。
下面列出的步驟詳細說明如何使用刪除重複數據工具:
- 刪除A. Thompson的兩個相同記錄中的第二個。
- 刪除R. Holt的第二部分匹配記錄。
打開刪除重複對話框
- 單擊示例數據庫中包含數據的任何單元格。
- 單擊功能區上的數據選項卡。
- 單擊刪除重複圖標突出顯示數據表中的所有數據並打開刪除重複對話框。
- “ 刪除重複項” 對話框顯示我們數據樣本中的所有列標題或字段名稱
- 字段名稱旁邊的複選標記指示Excel將在搜索重複記錄時嘗試匹配哪些列
- 默認情況下,當對話框打開時,所有的字段名都被關閉
查找完全相同的記錄
- 由於我們在本例中搜索的是完全相同的記錄,因此我們將檢查所有列標題
- 點擊確定
此時應該看到以下結果:
- 該對話框應該關閉並被一條消息所取代: 1找到並刪除重複值; 剩下7個唯一值。
- 包含重複A. Thompson記錄的行將從數據庫中刪除
- 即使R. Holt有兩個部分匹配的記錄,因為不是所有字段都匹配 - 兩條記錄的學生號碼不同--Excel認為它是唯一的數據記錄
02 02
通過刪除重複查找和刪除部分匹配記錄
一次檢查一個字段
由於Excel僅刪除與所選數據字段完全匹配的數據記錄,因此查找所有部分匹配的數據記錄的最佳方法是一次僅刪除一個字段的複選標記,如下面的步驟所述。
隨後搜索除名稱,年齡或程序以外的所有字段匹配的記錄將刪除部分匹配記錄的所有可能組合。
部分匹配記錄
- 如有必要,單擊包含數據表中數據的任何單元格
- 單擊功能區上的數據選項卡。
- 單擊刪除重複圖標突出顯示數據表中的所有數據並打開刪除重複對話框。
- 數據表的所有字段名稱或列標題均被選中。
- 要查找和刪除每個字段中沒有匹配的記錄,請刪除除Excel要忽略的字段名稱以外的複選標記。
- 對於這個例子,點擊Student ID列標題旁邊的複選框來刪除複選標記。
- Excel現在只會在姓氏 , 初始和程序字段中搜索並刪除具有匹配數據的記錄。
- 點擊確定
- 該對話框應該關閉並被一條消息所取代: 1找到並刪除重複值; 仍然有6個唯一值。
- 包含R. Holt的第二個記錄(學號為ST348-252)的行將從數據庫中刪除。
- 單擊確定關閉消息框
此時,示例數據表應該沒有所有重複數據。