雖然和優秀的HTML來源于同樣的技術SGML(類似HTML,也使用標記,屬性和值來格式化文檔結構),但XML卻完全不同于早期的標記語言,XML和HTML來源于同樣的技術,和XML是HTML的一個提升(盡管很像HTML,XML也用標簽,屬性,屬性值來定義文檔結構),且XML完全不同于HTML這種古老的標記語言,XML的目標是替代HTML. HTML是構架WEB頁面的一種基本語言,它由一些固定數量的標記和看起來好像有些矛盾的規則組成,在HTML中,你可以使用或者不使用關閉某些標記,這種松散的規則使人們創建一個WEB頁面變得很容易,甚至他們不需要完全知道他們在做什么,這便是問題的核心所在. 在早期,那時候WEB只需要基本的仙鶴并不需要更多其他信息,HTML是個很好的解決方法,但在今天,那些歷經過成長的網站,經常需要頻繁通過發布工具重新組裝頁面,經常需要將內容從數據庫發布到WEB頁面或者無線設備,但在HTML缺少這種統一的規則,從而阻礙了數據的轉化,我們很容易把文本轉化成HTML,但是很難把標記在HTML文件中的數據轉換成我們需要的其他文件格式. 同樣,HTML,僅僅是一種格式化語言,而不是一個能確切描述自己的語言,它沒有任何信息來描述探疑所格式化的語言,因此限制了我們征用這些內容的能力,當然,HTML確實是適用于WEB頁面的. 相對而言,基于XML的標記,則由一些統一的規則組成并且具備超越WEB領域的能力,當你用XML分寸 個文檔的時候,你不僅僅要考慮把它們在WEB頁面中顯示出來,你還應當對標記進行編碼,以便使得任何支持XML的環境都能理解你的XML文檔.