什麼是 sitemap？為何它對 AI 引擎重要？

sitemap 是網站的內容地圖，告訴 AI 引擎哪些頁面存在。AI 引擎會根據 sitemap 抓取資料，如果沒有正確的 sitemap，AI 可能完全找不到你的內容。

robots.txt 是什麼？為何會影響 AI 爬蟲？

robots.txt 是網站的「訪客指引」，告訴搜尋引擎與爬蟲哪些資料不能抓。如果寫錯了，AI 引擎的爬蟲可能被錯誤拒絕訪問，導致內容無法被引用。

AI 引擎不只是抓文字，它也會解析結構化資料，以判斷內容類型與實體關聯。如果沒有結構化資料，AI 可能無法正確理解這篇文章的內容，影響引用率。

多語網站的 sitemap 應該按照語言分開設定，並在 sitemap 中正確標明語言與網域。例如，zh-TW 站的 sitemap 應該對應到 truelink-group.com，而 en 站則對應到 truenodes.ai。

sitemap 沒更新，AI 引擎可能找不到你最新的文章或資料，導致內容被遺漏。尤其在高頻更新的網站（如部落格），應設定自動更新機制，確保 sitemap 持續更新。

項目	檢查內容	是否符合
sitemap 存在	網站有 `/sitemap.xml`	☐ 是 / ☐ 否
sitemap 格式正確	檔案格式符合 Google 規範	☐ 是 / ☐ 否
sitemap 註冊 Search Console	已在 Google Search Console 提交	☐ 是 / ☐ 否
robots.txt 允許 AI 爬蟲	沒有錯誤地拒絕 AI 引擎（如 `Googlebot`、`GPTBot`、`ChatGPT-User`、`PerplexityAI`）	☐ 是 / ☐ 否
robots.txt 沒有過度限制	沒有用 `Disallow: /` 等完全拒絕語法	☐ 是 / ☐ 否

項目	檢查內容	是否符合
sitemap 包含結構化資料頁面	每一篇部署了 schema.org 標記的文章 URL 皆已納入 `sitemap.xml`	☐ 是 / ☐ 否
schema.org 文章類型正確	每篇文章使用 `Article` 或 `FAQPage` 等結構化資料類型	☐ 是 / ☐ 否
schema.org 作者與發布者連結	作者與發布者透過 `Person`、`Organization` 與 `sameAs` 連結，建立信任鏈	☐ 是 / ☐ 否

項目	檢查內容	是否符合
hreflang 標籤正確	每個語言版本都有正確的 `hreflang` 標籤	☐ 是 / ☐ 否
多語 sitemap 對應正確	`sitemap.xml` 與語言站對應正確（如 zh-TW 對應 truelink-group.com）	☐ 是 / ☐ 否
多語網站結構清晰	網站有明確的語言分站策略，並在 sitemap 中正確標示	☐ 是 / ☐ 否

項目	檢查內容	是否符合
sitemap 自動更新	有自動更新機制（每次更新內容時自動觸發）	☐ 是 / ☐ 否
sitemap 更新頻率合理	高頻更新內容（如部落格）應有定期更新機制	☐ 是 / ☐ 否
檢查 Search Console 抓取狀態	查看 Google Search Console 的「抓取錯誤」與「sitemap」狀態	☐ 是 / ☐ 否