跳至內容

南京市歷史地名名錄數據集

維基文庫,自由的圖書館
南京市歷史地名名錄數據集
作者:張逸卿 胡迪 於璐 馮慶普 張佘淑
2020年1月13日
本作品收錄於《中國科學數據
張逸卿, 胡迪, 於璐, 等. 南京市歷史地名名錄數據集[J/OL]. 中國科學數據, 2020, 5(1). (2019-08-01). DOI: 10.11922/csdata.2019.0025.zh.


摘要&關鍵詞[編輯]

摘要:南京歷史悠久,文化資源豐富,其歷史地名使用廣泛、內涵豐富,對研究城市發展、歷史文化和社會風俗具有重要的意義。本文選取南京市地名委員會公布的第一、二批南京市歷史地名名錄中的地名為研究對象,採用國家標準分類和地名名錄分類兩種分類方法。參考《南京地名大全》、《中國歷史地名大辭典》和《中國古今地名大詞典》等,收集地名資料。以地名信息服務國家標準為基礎,拓展歷史地名相關信息,確定了地名名稱、位置描述、相關人物等地名字段。依據關鍵字、詞提取字段數據,整理和完善歷史地名信息,構建了包含232條歷史地名記錄,15個地名字段信息的南京市歷史地名名錄數據集,有利於傳承歷史地名文化,合理利用歷史地名資源,可用於歷史變遷和城市文化等方面的研究。

關鍵詞:歷史地名;數據共享;地名文化;歷史GIS

Abstract & Keywords[編輯]

Abstract: Nanjing has a long history and rich cultural resources. Its historical place names are widely used and have profound connotations. It is of great significance to studies of the urban development, history, culture and social customs. According to the list of historical place names published by The Committee of Nanjing Place Names, this article chooses the historical place names and classifies them in two ways. Referring to Complete Collection of Nanjing Place Names, Dictionary of Chinese Historical Place Names and Dictionary of Place Names in Ancient and Modern China, the study collects the data of place names. Based on the National Standard of Geographical Names Information Service, we expand the related information of historical place names and add fields, including place names, location description, related people etc. We add fields according to the keywords, organize the information of historical place names and build the dataset of Nanjing Historical Place Names List which contains the record of 232 historical place names and the field information of 15 place names. It is conducive to inheriting the historical place names culture and making good use of the resources of historical place names. It also can be used for the research and application of historical changes and urban culture.

Keywords: historical place names; data sharing; place name culture; historical GIS

數據庫(集)基本信息簡介[編輯]

數據庫(集)名稱 南京市歷史地名名錄數據集
數據作者 張逸卿、胡迪、於璐、馮慶普、張佘淑
數據通信作者 胡迪([email protected]
數據時間範圍 上限為公元前571年,下限為2010年底
地理區域 今南京市行政區劃範圍
數據量 103 KB
數據格式 *.xlsx
數據服務系統網址 http://www.sciencedb.cn/dataSet/handle/789
基金項目 國家自然科學基金項目(41771421、41601412);江蘇高校品牌專業建設工程資助項目。
數據庫(集)組成 數據集為一張Excel數據表,包含232條歷史地名記錄,每條記錄包含15個字段信息。

Dataset Profile[編輯]

Title A dataset of the name list of Nanjing historical places
Data authors Zhang Yiqing, Hu Di, Yu Lu, Feng Qingpu, Zhang Sheshu
Data corresponding author Hu Di ([email protected])
Time range 571 B.C – 2010 A.D
Geographical scope The scope of administrative divisions in Nanjing today
Data volume 103KB
Data format *.xlsx
Data service system < http://www.sciencedb.cn/dataSet/handle/789>
Sources of funding National Natural Science Foundation of China (41771421, 41601412); Top-notch Academic Programs Project of Jiangsu Higher Education institutions.
Dataset composition The dataset is an Excel data table, which contains the record of 232 historical place names. Each record includes 15 fields.


引 言[編輯]

地名是人們對具有特定方位、地域範圍的地理實體賦予的專有名稱,具有指位性與社會性,是人們工作、生活、交往不可缺少的工具[1]。歷史地名的變遷記錄了城市演變、民族變遷的過程[2],能夠為歷史發展的研究提供重要線索和依據[3][4]。歷史地名作為一種文化形態,蘊含了豐富的文化內涵信息,是人們了解城市歷史文化的重要工具[5][2]。研究歷史地名信息對合理利用歷史地名資源,改善歷史地名信息共享具有重要意義。

現有的地名信息共享根據共享的信息多少可以分為兩類:一類是地名基本信息共享;另一類是地名基本信息和其他信息共享。國外地名命名較規則,地名數據庫標準和規範較為統一[6],各種開放的地名數據共享服務主要關注地名基本信息。美國地質勘察局聯合地名委員會建立了美國地名信息系統(Geographic Names Information System, GNIS),其本質是包含了地理位置與名稱的數據庫[7]。美國國家測繪部門、國家統計署、國家郵政局和美國**等相關機構聯合進行數據收集,建立了全球地名地理數據庫(GeoNames),地名數據包括坐標、行政區劃、郵政編碼、人口、海拔和時區等屬性[8]。目前中國已建成的全國1:100萬、1:25萬、1:5萬、1:1萬基礎地理信息數據庫中均包含地名數據庫[9],存儲和管理了對應比例尺地形圖上的各類地名信息,包括政區、居民地、河流、湖泊、島礁、山脈、沙漠、盆地、自然保護區的名稱及屬性等[10]。依託第二次全國地名普查的成果,中國啟動開通了中國·國家地名信息庫,提供地名名稱、讀音、位置、類別等基本屬性信息,來歷、含義、歷史沿革等文化屬性信息,以及行政區劃、界線界樁、地名專用字和專讀音等信息[11]。上述地名信息共享囊括了較為全面的地名基本屬性信息,數據量大且分布廣泛,也共享了一定的地名相關的社會、經濟和文化信息,但對於地名相關人事物等地名文化相關信息關注仍然不夠。時間、地點、人物、事件和場景關係密切[12],對研究歷史沿革和區域文化具有重要作用,因此,本數據集不僅共享了歷史地名基本信息,也關注了歷史地名文化相關信息。

南京是國務院首批公布的歷史文化名城之一,具有近2500年的建城史和近500年的建都史[13][14],其城市發展規律及歷史文化具有一定的代表性。因此,本文以南京市歷史地名名錄(第一、二批)中的232個歷史地名為研究對象,查閱並收集整理了南京出版社2012年版《南京地名大全》、中國社會科學出版社2005年版《中國歷史地名大辭典》和上海辭書出版社2005年版《中國古今地名大詞典》中的歷史地名資料,關注歷史地名相關信息和文化內涵,建立了南京市歷史地名名錄數據集,為研究南京城市發展演變和歷史文化提供了數據基礎。

1 數據採集和處理方法[編輯]

本數據集的地名數據來源為南京市第一、二批歷史地名名錄,地名信息主要採集於《中國歷史地名大辭典》和《南京地名大全》,部分缺失的地名信息補充於《中國古今地名大詞典[15][16][17]。本數據集採用了兩種地名分類方法:根據《地名分類與類別代碼編制規則》國家標準(GB/T18521-2001)進行地名分類;保留歷史地名名錄中的地名分類方法。主要技術流程如圖1所示。


圖片

圖1 數據集生成技術流程圖


1.1 數據來源[編輯]

本數據集基於南京市地名委員會公布的南京市第一、二批歷史地名名錄[18],以其全部232個歷史地名作為本文的研究對象。表1所示為該歷史地名名錄。


表1 南京市歷史地名名錄

地名分類 批次 歷史地名
古政區名 1 金陵、建業、建鄴、江寧、白下、秣陵、湖熟、應天、南京、棠邑、六合、江浦、溧水、高淳
2 江乘、浦口、上元
古聚落名 1 小營、七家灣
2 湯泉、龍潭、攝山、橫梁、龍袍、柘塘、薛城、小市、蘭花塘、五貴里、大定坊、古雄、天后村、佘村、山陰村、楊柳村、竇村、朱門村、馬場山村、石塘村、郄坊村、卸甲甸、方巷、倉口村、桑園蒲村、石灘頭村、漆橋村、河城村、鶴窠里村
古山川名 1 鐘山、梅花山、富貴山、九華山、清涼山、雨花台、獅子山、棲霞山、幕府山、湯山、祖堂山、方山、牛首山、三山、桂子山、冶山、老山、燕子磯、秦淮河、金川河、珍珠河、清溪、進香河、玄武湖、莫愁湖、烏龍潭、黃天盪、石臼湖
2 窨子山、四望山、清涼山、五台山、獅子嶺、韓府山、東山(土山)、芝麻嶺、東廬山、大游山、珍珠泉、老鸛河、百家湖、龍池、胭脂河、固城湖、胥河
古街巷名 1 成賢街、估衣廊、漢府街、四牌樓、中華路、烏衣巷、狀元境、明瓦廊、御道街、金鑾巷、貢院街、三元巷、柳葉街、評事街、鈔庫街、長干里、堂子街、龍蟠里、虎踞關、商埠街、中山大道
2 碑亭巷、丹鳳街、網井市、東大影壁和西大影壁、花露崗、鳳游寺街、同鄉共井、箍桶巷、螺絲轉彎、楊公井、尚書巷、沈舉人巷、傅厚崗、湖南路、頤和路、北京西路、左所大街、能仁里、專諸巷、通濟街、中山大街(高淳老街)
古勝跡名 1 台城、桃葉渡、朝天宮、瞻園、鳳凰台、杏花村、冶城、大勝關、靜海寺、石頭城
2 甘熙宅第、烏龍潭、陽山碑材、六合文廟、花神廟、定林寺、永濟寺、無想寺、永壽寺、保勝寺塔
古建築名 1 棲霞寺、雞鳴寺、北門橋、半山園、明故宮、鼓樓、聚寶門、水西門、通濟門、神策門、明孝陵、中山門、文德橋、朱雀橋、賽虹橋、總統府、中山陵
2 逸仙橋、竺橋、長干橋、毛公渡、金陵大學舊址(南京大學)、點將台、仙鶴門、觀音門、新亭、勞勞亭、東善橋、蒲塘橋、襟湖橋
古紀念地名 1 鄭和墓
2 初寧陵、萬安陵、南唐二陵、拉貝舊居
其他 1 夫子廟、三山街、新街口、大行宮、江東門、龍江關(下關)、越城
2 安德門、花旗營、金陵驛、固城遺址
千年古鎮 1 橋林鎮、江寧鎮、秣陵鎮、板橋鎮、湖熟鎮、陶吳鎮、淳化鎮、丹陽鎮、湯山鎮、祿口鎮、麒麟鎮、土橋鎮、雄州鎮、瓜埠鎮、竹鎮、長蘆鎮、在城鎮、洪藍鎮、淳溪鎮、固城鎮
紅色地名 2 雨花台烈士陵園、中國共產黨代表團梅園新村紀念館、侵華日軍南京大屠殺遇難同胞紀念館、南京抗日航空烈士紀念館、南京渡江勝利紀念館、高淳新四軍一支隊紀念館、兩浦鐵路工人「二七」大罷工指揮所舊址、八路軍駐京辦事處舊址、六合竹鎮抗日民主政府舊址、溧水李巷新四軍紀念館、江寧橫山烈士陵園


以上述歷史地名為研究對象,本數據集參考了《南京地名大全》《中國歷史地名大辭典》和《中國古今地名大詞典》中記載的相關歷史地名資料,進行了歷史地名信息的採集、歸納、整理和校對。

以歷史地名名錄第一批中的古勝跡名「鳳凰台」為例,其在三本書中的地名信息如圖2所示。


圖片(a)

圖片(b)

圖片(c)

圖2 歷史地名數據來源(a)《南京地名大全》 (b)《中國歷史地名大辭典》 (c)《中國古今地名大詞典


1.2 地名分類[編輯]

地名分類與類別代碼編制規則》國家標準(GB/T18521-2001)採用四級分類方法,計2個門類,11個大類,64個中類和171個小類。為遵守地名信息處理與交換的規範,依據該標準的地名分類方法,本數據集將歷史地名分類至第二級,共11個大類。這種分類方法符合建設國家地名信息系統的標準,有利於進行地名數據標準化存儲和共享,支持互操作。

本數據集的研究對象是歷史地名,由於古今地名用語、地名構成不同,現有的地名分類體系難以完全滿足歷史地名的分類需求[19]。南京市地名委員會在發布南京歷史地名名錄時,提供了一種歷史地名分類,即將名錄中的歷史地名分為古政區名、古聚落名、古山川名、古街巷名、古勝跡名、古建築名、古紀年地名、千年古鎮、紅色地名和其他(含古區片、古地片、古驛站、古渡口、古遺址等),共10類。這種分類類別數量適中,符合以地名功能為基礎進行分類的原則,有利於歷史地名相關信息的採集與整理,歷史地名文化內涵的表達,以及政府地名管理與保護。

1.3 數據處理[編輯]

根據國家標準《地名信息服務 第1部分:通則(GB/T23295.1-2009)》,並參考中國·國家地名信息庫、全國大比例尺地名數據庫等現有地名數據庫以及地名研究相關文獻[20][9][6][5]中的地名字段,將採集的歷史地名原始數據進行拆分和整合。本數據集中的歷史地名字段包括標準地名、繁體地名、漢語拼音、地名類別(國標)、地名類別(名錄)、位置描述、開始時間、今名、得名原因等歷史地名基本屬性信息[21],以及相關人物、事件、作品等歷史地名文化相關信息,無法歸入以上類別的剩餘信息歸為其他信息。此外,本數據集採用了兩種地名分類方法,有針對性地進行地名信息的篩選和整合。

歷史地名信息的拆分和提取工作可以分為歷史地名基本信息提取、歷史地名相關信息提取兩部分,主要是依據地名信息中的關鍵字、詞或固定句式進行語義判斷。歷史地名基本信息包括位置描述、得名原因、開始時間和今名。根據「在」、「位於」等表示位置的字樣,可提取該地名的位置描述信息;根據「以……得名」、「故稱」等提示得名原因的句式或短語,可提取地名的得名原因信息;地名的開始時間與得名原因通常先後出現,因此可根據「……年,因……得名」等句式,輔之以語義判斷,提取地名的開始時間信息;根據「後易今名」、「仍名……」、「……已拆毀,地名沿用」等提示名稱的短語或句式可提取地名的今名信息。歷史地名相關信息包括相關人物、事件和作品。相關信息通常在同一句中或前後句中出現,語義完整、連貫。與基本信息不同,相關信息幾乎沒有固定的關鍵字、詞和句式,因此需要根據語義進行判斷和信息篩選。

資料來源對於用戶了解數據的可靠性和準確性,以及數據使用非常重要。由於資料來源不同,地理名稱和地名信息存在差異[22],因此本文設計了資料來源字段。該字段記錄了每條歷史地名的信息來源,根據在其中提取信息量的大小對不同來源進行排序,並以分號分隔。本數據集的資料來源主要包括《南京地名大全》、《中國歷史地名大辭典》、《中國古今地名大詞典》、中國·國家地名信息庫、官方傳媒網站以及相關文獻等。對於位置描述、開始時間、今名3個重要字段,對照《中國歷史地名大辭典》進行地名信息核實。若信息含義相同或相近,則不做改動,若原字段信息含義與之不同或差別較大,則採用《中國歷史地名大辭典》中的信息,對數據集進行更改。

2 數據樣本描述[編輯]

2.1 地名分類統計分析[編輯]

經統計,收集並整理得到有效的歷史地名數量如下:第一批南京歷史地名名錄共計120條;第二批南京歷史地名名錄共計112條。

根據《地名分類與類別代碼編制規則》國家標準進行地名分類,本數據集中各類地名的數量分布如圖3所示。可明顯看出,具有地名意義的紀念地、旅遊勝地和具有地名意義的交通運輸設施,這兩類地名的數量較多,其占比較大;在這兩批地名名錄中,不存在屬於海域的地名。


圖片

圖3 國家標準地名分類統計圖


經統計,根據歷史地名名錄中的地名分類,本數據集中各類地名的數量分布如圖4所示。可明顯看出,古山川名和古街巷名在這兩批名錄中數量較多、所占比重較大;古紀念地名數量最少,占比最小。


圖片

圖4 歷史地名名錄地名分類統計圖


2.2 歷史地名相關信息[編輯]

歷史地名作為一種文化形態,蘊含了豐富的歷史文化內涵,見證了城市的發展變遷,對探索不同時期的城市空間格局具有重大意義。本研究特別關注了地名相關的歷史文化信息,在錄入歷史地名基本屬性信息的基礎上,增加了開始時間,得名原因,相關歷史人物、事件和作品等體現地名歷史文化信息的字段。

根據地名分類,有針對性地進行地名信息的篩選和整合。不同類型的歷史地名,其相關信息具有一定差異。就相關事件而言,自然地理實體的地名,例如古山川名,其相關事件信息大多與戰爭等政治活動有關,由於其地理位置和範圍變化相對較小,地名歷史沿革也較少。而人文地理實體的地名,其相關事件大多與社會、經濟和文化等有關,例如古街巷名;此外,其地名歷史沿革也更加豐富,如古政區名,其政區範圍、治所都可能發生改變,地名名稱也隨之變化。

3 數據質量控制和評估[編輯]

關於南京歷史地名的記載自吳越以來已有2000多年的歷史,經歷了十個朝代的更迭,多達萬餘條[16],數據基礎好。以南京市地名委員會公布的南京市歷史地名名錄為數據來源,依據可靠。《南京地名大全》、《中國歷史地名大辭典》和《中國古今地名大詞典》三本公開發行的地名大全和辭典中地名位置描述、得名原因、相關歷史人物、事件等內容皆有記載,數據詳盡、質量控制嚴格。本研究根據《地名信息服務(GB/T23295-2009)》,考慮歷史地名特點,確定了標準地名、羅馬字母拼寫、地名分類、位置描述、得名原因等地名字段,數據存儲與管理符合標準規範,數據準確,內容豐富。本數據集依據《地名分類與類別代碼編制規則(GB/T18521-2001)》和南京地名委員會發布的歷史地名名錄中的分類方法,分類合理,保證了數據的規範性,有利於數據存儲與信息共享,同時也突顯了歷史地名的文化內涵。對於位置描述、開始時間、今名3個重要字段,對照《中國歷史地名大辭典》中進行地名信息核實。其中,211條地名記錄的字段信息與之含義相同或相近,不做改動;21條地名記錄的地名字段與之含義不同或差別較大,採用《中國歷史地名大辭典》中的信息對數據集進行更改。數據的整理和校對工作分類開展,對於標點、用字、語法等進行檢查校對,同一字段信息採用相同或相似的表達方式,保證了數據的一致性和正確性。

4 數據使用方法和建議[編輯]

主流的編程語言均可調用相關函數庫讀寫本數據集,實現數據批處理。本數據集為研究城市歷史發展演變、歷史地名文化內涵等提供了數據基礎,也可用於各類數字媒體地名服務(如網絡地名服務)。地名數據準確全面,可供用戶根據不同的興趣內容進行參考、分析和研究。

參考文獻[編輯]

  1. 王際桐. 地名學概論[M]. 北京: 中國社會出版社, 1993.
  2. ^ 2.0 2.1 尹鈞科. 略論地名的主要性能[J]. 中國歷史地理論叢. 1997, 23(2): 127-142.
  3. 韓光輝. 中國地名學的地名淵源和地名沿革的研究[J]. 中國歷史地理論叢, 1991 (4): 241-251.
  4. 韓光輝. 中國地名學的發展[J]. 中國科技史雜誌, 1993 (4): 3-14.
  5. ^ 5.0 5.1 李黎. 基於GIS的歷史地名採集[J]. 測繪通報, 2011 (10): 70-72.
  6. ^ 6.0 6.1 李金良, 張雪英, 樊曉春. 漢語地名時空信息的一體化表達[J]. 地理與地理信息科學, 2010, 26(6): 6-10.
  7. 美國地名資訊管理系統. 美國國家地名委員會與美國地址調查局. [2019-05-14]. http://geonames.usgs.gov/.
  8. Ahlers D. Assessment of the accuracy of GeoNames gazetteer data[C]// Workshop on Geographic Information Retrieval, 2013.
  9. ^ 9.0 9.1 狄琳, 歐陽宏斌. 全國1:25萬地名數據庫的設計與建立[J]. 測繪通報, 2001 (10): 32-33.
  10. 商瑤玲, 張元傑, 張義, 等. 國家基礎地理信息地名數據更新軟件系統設計與研發[J]. 測繪科學, 2008 (s2): 96-97.
  11. 中國·國家地名信息庫. [2019-05-29]. http://dmfw.mca.gov.cn/.
  12. 劉龍雨, 胡迪. 《讀史方輿紀要》數據庫建設中地名解析的原則與方法[J]. 江蘇科技大學學報(社會科學版), 2014 (4): 29-34.
  13. 郭文權. 南京歷史文化名城保護思考[J]. 現代城市研究, 2005, 20(9): 50-53.
  14. 奚永華, 裘行潔, 王桂圓. 南京歷史文化名城保護的過去與未來[J]. 南京社會科學, 2004 (s1):156-166.
  15. 戴均良. 中國古今地名大詞典[M]. 上海: 上海辭書出版社, 2005.
  16. ^ 16.0 16.1 南京地名大全》編委會. 南京地名大全[M]. 南京: 南京出版社, 2012.
  17. 史為樂. 中國歷史地名大辭典[M]. 北京: 中國社會科學出版社, 2005.3.
  18. 南京市歷史地名名錄》公告. 南京市民政局. (2019-03-26) [2019-05-14]. http://mzj.nanjing.gov.cn/njsmzj/njsmzj/201903/t20190326_1477397.html.
  19. 于靖, 陳剛, 李剛. 城市歷史地名分類及編碼體系研究[C]// 中國城市規劃年會. 2016.
  20. 鍾遠軍, 李照, 林澍哲, 等. 基於PostGIS的地名數據庫設計與應用研究[J]. 測繪與空間地理信息, 2011, 34(3): 100-107.
  21. 王桂敏. 地名數據庫錄入方法的優化[J]. 測繪科學, 1994 (4): 33-35.
  22. 王俊超. 多尺度地理空間信息中地名數據一致性處理研究[D]. 中國人民**信息工程大學, 2013.

數據引用格式[編輯]

張逸卿, 胡迪, 於璐, 等. 南京市歷史地名名錄數據集[DB/OL]. Science Data Bank, 2019. (2019-08-01). DOI: 10.11922/sciencedb.789.


本作品在「知識共享-署名 4.0 國際」協議下發表。

Public domainPublic domainfalsefalse