Structured data (hay Schema/dữ liệu có cấu trúc) từ lâu đã được hỗ trợ bởi Google và các máy tìm kiếm khác. Nó đã trở thành một cách thức hữu hiệu cho nhiều website triển khai các đánh dấu dữ liệu (gọi là markup) phù hợp với lĩnh vực, ngành nghề hoạt động của họ. Dữ liệu có cấu trúc là một mảng không ngừng phát triển trong SEO, với nhiều sự cập nhật, tinh chỉnh liên tục.
Nhưng tương lai của Schema sẽ ra sao? Liệu nó sẽ sớm “tàn” trong một thế giới của những công nghệ máy học (machine learning), của những nội dung được viết bởi máy tính (computer written content) và khoa học dữ liệu (data science)? Hay nó sẽ trở thành một tính năng bắt buộc phải có của mọi website? Trong bài viết dưới đây, hãy cùng Đào tạo SEO Á Âu tìm hiểu sâu hơn về những câu hỏi này.
Schema đã phát triển như thế nào?
Cho đến năm 2011, đã có một lượng lớn các tiêu chuẩn khác nhau dành cho Schema, và các nhà quản trị website ở thời điểm đó có người đã thực hiện một vài trong số chúng, có người thực hiện tất cả và cũng có người không làm gì cả vì sợ… làm sai. Có nhiều bộ ngôn ngữ dữ liệu (vocabulary) và tiêu chuẩn (standard) khác nhau và tất cả đều có phần hơi khó hiểu. Đó là lúc Schema.org ra đời.
Yahoo, Bing, Yandex và Google đã hợp tác với nhau trong một nỗ lực nhằm tạo ra một bộ tiêu chuẩn chung được hỗ trợ trên tất cả các công cụ tìm kiếm.
Kể từ khi được thành lập, Schema.org đã có sự phát triển vô cùng mạnh mẽ, từ điểm bắt đầu chỉ với tổng cộng 297 Loại (Types) với 187 Thuộc tính (Properties), cho đến một con số ấn tượng 615 Loại với 901 Thuộc tính.
(Nguồn: Wikimedia)
Các phát kiến cho Schema.org không ngừng được phát triển và ngày càng có nhiều chủng loại và thuộc tính dữ liệu hơn được bổ sung vào. Trên website của Schema.org còn có cả một phần dành cho các ý tưởng đang “treo” (pending) chờ được xử lý:
“Đây là khu vực chứa các cụm từ ngữ đang trong quá trình xử lý và hiện chưa được chấp nhận để đưa vào bộ ngôn ngữ dữ liệu cốt lõi. Các từ ngữ này có thể thay đổi và nên được sử dụng một cách cẩn trọng.”
Ví dụ, một vài loại đánh dấu dữ liệu hiện đang được hỗ trợ bao gồm:
- LocalBusiness (doanh nghiệp địa phương)
- Restaurant (nhà hàng)
- Event (sự kiện)
- Review (đánh giá)
- Product (sản phẩm)
Và các thuộc tính đi kèm với các loại hình này:
- OpeningHours (giờ mở cửa)
- servesCuisine (món ăn phục vụ)
- remainingAttendeeCapacity (còn tiếp nhận được bao nhiêu khách)
- itemReviewed (sản phẩm được review)
- releaseData (ngày ra mắt)
Không phải tất cả mọi chủng loại (types) đều có những thuộc tính (properties) đặc thù riêng, và có thể “mượn” một vài thuộc tính từ những loại khác.
Các types & properties có thể được triển khai thông qua 3 phương thức khác nhau:
- Microdata
- RDFa
- JSON-LD
Thông tin chi tiết về 3 cách thức này được trình bày trên website Schema.org. Trên trang của mỗi loại hình có nhiều ví dụ về cách thức triển khai tương ứng:
Google đã đề cập cụ thể (https://developers.google.com/search/docs/guides/sd-policies) rằng họ thích Schema được triển khai dưới định dạng của ngôn ngữ JSON-LD. Nó dễ thực hiện hơn vì nó không bị “chồng chéo” với nội dung của HTML như 2 phương thức còn lại.
Có nhiều bộ ngôn ngữ (vocabulary) vẫn được hỗ trợ bên ngoài Schema.org, nhưng chúng ngày càng ít phổ biến hơn. Google đã dự kiến sẽ không còn hỗ trợ định dạng data-vocabulary (bộ ngôn ngữ được xây dựng bởi data-vocabulary.org) của dữ liệu có cấu trúc. Vì thế, các webmaster nên gỡ đi bất kỳ structured data nào hiện đang tồn tại dưới định dạng data-vocabulary và cập nhật nó thành phiên bản JSON-LD Schema.org được khuyến nghị.
Số lượng lớn các loại dữ liệu có cấu trúc hiện tại trên Schema.org lại đặt ra một câu hỏi: Liệu có nên triển khai bất kỳ (hoặc tất cả) loại Schema nào có thể áp dụng các dữ liệu mà bạn đang cung cấp cho người dùng, và sau cùng, là Google không?
Google chỉ chính thức hỗ trợ một số lượng các loại Schema đã xác định, điều này cho phép điều chỉnh/cải thiện các kết quả trên trang SERPs. Có lẽ loại dữ liệu có cấu trúc phổ biến và rõ ràng nhất mà chúng ta đã từng thấy chính là loại Schema Review/Rating như trong ví dụ dưới đây:
Google cũng từng phát biểu trong nhiều dịp rằng một website có Schema càng đầy đủ, thì khả năng nó xuất hiện trên hệ thống tìm kiếm càng cao.
“Nói chung, việc càng làm rõ các tính năng được khuyến nghị càng làm cho thông tin của bạn có thể được xuất hiện trong các kết quả tìm kiếm với khả năng hiển thị được cải thiện. Tuy nhiên thì, quan trọng nhất vẫn là cung cấp ít thuộc tính được đề xuất hơn nhưng nó phải đầy đủ và chính xác, thay vì cố gắng đưa ra mọi thuộc tính có thể nhưng dữ liệu thì lại sai sót, kém hoàn chỉnh hoặc được định dạng chưa tốt.”
Ở trên, chúng ta vừa điểm qua một vài nét trong quá khứ, bây giờ hãy cùng thảo luận về tương lai.
Schema sẽ phát triển đến đâu?
Dự đoán 1 – Google sẽ chỉ hỗ trợ dữ liệu có cấu trúc dưới định dạng JSON-LD Schema.org
Như đã đề cập ở trên, Google đã thông báo họ sẽ ngưng hỗ trợ cho loại dữ liệu có cấu trúc data-vocabulary.org đã không còn phù hợp nữa.
(Nguồn: Internet)
Điều quan trọng rút ra được từ thông báo này đó là Google sẽ loại bỏ các bộ ngôn ngữ dữ liệu cũ kỹ và nhàm chán. Schema.org hiện đang là loại dữ liệu có cấu trúc duy nhất được Google chính thức hỗ trợ để đưa ra các kết quả tìm kiếm có định dạng phong phú (rich result). Liệu Google sẽ tiến thêm một bước nữa hay không?
Google đã công khai nói rằng họ thích ngôn ngữ JSON-LD Schema hơn và cũng cung cấp mọi thông tin về những cơ hội có thể khai thác với dữ liệu có cấu trúc:
https://developers.google.com/search/docs/guides/intro-structured-data
Hiện tại bạn vẫn có thể triển khai Schema bằng các phương thức như RDFa hay Microdata nhưng chúng không được Google xem là hiệu quả và ưa thích bằng JSON-LD. Dường như Google chỉ “chừa lại” cho chúng ta một phương pháp tiềm năng nhất để áp dụng dữ liệu có cấu trúc. Và có thể là một ngày nào đó, chúng ta sẽ có thông báo chính thức về sự ưu tiên này.
Dự đoán 2 – Google sẽ tăng cường hỗ trợ trong Google Search Console
Khả năng hỗ trợ đối với nhiều loại hình Schema trong Google Search Console đã được cải thiện, với loại Schema gần đây nhất là “SpecialAnnouncement”.
(Nguồn: Internet)
Các loại báo cáo trong GSC này thực sự rất hữu ích, trong đó, Google sẽ làm nổi bật bất kỳ cảnh báo hoặc lỗi nào có thể nhìn thấy được trên trang của bạn với loại Schema được áp dụng tương ứng. Đây là một phương pháp tốt hơn nhiều so với các phương pháp trước đây chúng ta vẫn hay sử dụng để phát hiện những lỗi khi triển khai Schema trên một loạt các trang.
Những người làm SEO đã từng phải sử dụng trình thu thập dữ liệu của công cụ Screaming Frog, với bộ xác thực dữ liệu có cấu trúc do chính công cụ này tạo ra, nhưng điều này cũng chỉ mới khả dụng gần đây. Tất nhiên là Google cũng sở hữu công cụ Structured Data Testing Tool của riêng họ, nhưng lại không có API nên việc kiểm tra hàng loạt trang để phát hiện các vấn đề mà Google nhìn thấy trở nên khá khó khăn. Ít nhất là với những loại report được hỗ trợ trong Google Search Console, chúng ta có thể nhận thấy được bất kỳ vấn đề nào đối với các loại Schema được hỗ trợ trên diện rộng.
GSC hiện đang cung cấp 15 loại báo cáo Schema khác nhau, bạn có thể xem danh sách đầy đủ tại đây:
https://support.google.com/webmasters/answer/7552505?hl=vi
Google có thể sẽ bổ sung thêm nhiều loại report này, vì họ chắc chắn muốn các nhà quản trị website triển khai Schema đúng cách. Xét cho cùng thì việc áp dụng Schema đúng cũng sẽ chia sẻ dữ liệu với cơ sở dữ liệu trí thức không ngừng được mở rộng của Google. Nếu xem qua thông tin về Search Gallery được Google cung cấp (https://developers.google.com/search/docs/guides/search-gallery) và so sánh nó v ới những loại Schema mà Google hỗ trợ xuất báo cáo, chúng ta có thể đưa ra những phỏng đoán có căn cứ về những loại report mới nào sẽ được thêm vào Google Search Console. Những loại này có thể bao gồm:
- Article (bài viết)
- Book (sách)
- Course (khóa đào tạo)
- Movie (phim ảnh)
- Podcast
Tất nhiên vẫn còn những loại Schema khác được Google hỗ trợ, chẳng hạn như Local Business, nhưng những dữ liệu liên kết với loại này sẽ khó để được hiển thị một cách tốt nhất sao cho hợp lý trong GSC.
Dự đoán 3 – Hệ quả của việc sử dụng Schema không đúng cách
Nếu bạn triển khai đánh dấu Schema không đúng cách, đồng nghĩa với việc bạn đi ngược lại với những khuyến nghị của Google, thì bạn có thể sẽ nhận được hình phạt “tác vụ thủ công” (dưới dạng Structured Data Manual Penalty) và Schema đó sẽ không được hiển thị trên SERPs cho đến khi bạn khắc phục vấn đề. Sau đó, bạn sẽ phải gửi đi yêu cầu kháng nghị, liệt kê ra chi tiết bạn đã làm gì để khắc phục tình trạng đó.
Tuy nhiên, có thể sẽ đến vài tuần hoặc thậm chí là hàng tháng để các trường hợp lạm dụng Schema hoặc sử dụng sai cách bị Google phạt tác vụ thủ công. Khi bạn đã gửi đi yêu cầu kháng nghị và các trang của bạn hiển thị trở lại Schema đó trên SERPs, thì điều gì có thể ngăn bạn (ngoài vấn đề đạo đức và mối đe dọa về một hình phạt tác vụ thủ công khác) ngay lập tức lại tiếp tục lạm dụng Schema theo cách cũ?
(Nguồn: Internet)
Một số cá nhân cho rằng Google có thể sẽ bắt đầu phạt nhiều hơn các trường hợp “spam” Schema hoặc sử dụng không đúng cách, và sẽ áp dụng các hình phạt này thông qua các phương thức tự động hóa, hơn là quy trình thủ công như hiện tại.
Hoặc Google sẽ tiến thêm một bước nữa, và đưa ra một hình phạt trầm trọng hơn cho các page triển khai dữ liệu có cấu trúc không chính xác? Có thể là một hình thức mà các trang không được hiển thị hoàn toàn trên Search, thay vì chỉ không hiển thị mỗi các tính năng của dữ liệu có cấu trúc? Google sẽ phải cập nhật tài liệu cụ thể hơn trước khi điều này xảy ra, để hạn chế bất kỳ sự mơ hồ nào.
Dự đoán 4 – Schema.org sẽ trở nên ngày càng to lớn hơn
Ngày 08/03/2021 vừa qua, Schema.org đã ra mắt một phiên bản ngôn ngữ mới (12.0) cho các dữ liệu có cấu trúc thuộc hệ thống này.
Ngoài một số phần xử lý lỗi và cải thiện chất lượng hơn cho những bộ ngôn ngữ chính (core terms), phiên bản này chứa những thay đổi chủ yếu tập trung vào phần pending.schema.org. Khu vực này thiên về những bộ ngôn ngữ mang tính thử nghiệm, các chủng loại và thuộc tính có thể được thử nghiệm trước khi được công bố như là một phần của hệ thống chính thức.
Thường thì vài tháng, các phiên bản nâng cấp hơn của Schema lại được công bố. Do những cập nhật gần đây chưa có những thay đổi nào quá lớn ảnh hưởng đến bộ ngôn ngữ cốt lõi nên đợt cập nhật lớn tiếp theo có thể sẽ chứa nhiều điều thú vị. Nhiều khả năng chúng ta sẽ thấy một số lượng các chủng loại dữ liệu đang ở trạng thái “pending” sẽ chính thức được đưa vào áp dụng. Khi điều đó xảy ra, tùy vào các công cụ tìm kiếm sẽ bắt đầu triển khai hỗ trợ cho những loại Schema phù hợp để cung cấp thêm nhiều giá trị cho tìm kiếm của người dùng.
Tổng kết
Chúng ta đã xem qua tổng quan về sự phát triển của Schema.org, từ khởi điểm khiêm tốn của nó vào năm 2011, cho đến những bản cập nhật phổ biến gần đây với tiềm năng ảnh hưởng đến toàn bộ cuộc chơi tìm kiếm trên Internet.
Còn bạn thì sao, bạn dự đoán Schema sẽ thay đổi như thế nào trong thời gian sắp tới? Hãy cùng theo dõi và đón chờ những điều thú vị nhé! Dù có cập nhật gì đi nữa thì công việc của chúng ta vẫn là tiếp nhận những luật chơi mới và tìm cách nâng cao trải nghiệm cả cho người dùng và các máy tìm kiếm, chỉ khi đó chúng ta mới thực sự đang tạo ra giá trị.
Ý kiến của bạn