Ưu nhược điểm của các file PDF trong SEO

Thảo luận trong 'Thủ thuật Seo - Seo tips' bắt đầu bởi mkt, 27 Tháng một 2014.

  1. mkt

    mkt Member

    Tôi hy vọng rằng hầu hết mọi người làm việc trong SEO đều biết rằng các file PDF được lập chỉ mục trong công cụ tìm kiếm. PDF cũng có thể xuất hiện với một snippet tác giả trong Google SERPs. Nhưng với chỉ một định dạng tập tin mà có thể được lập chỉ mục không có nghĩa rằng đó là biện pháp lý tưởng. Hôm nay, tôi muốn khám phá những ưu và nhược điểm của các file PDF từ góc độ SEO.

    [​IMG]

    Các ưu điểm khi sử dụng các file PDF

    Có một số ưu điểm khi sử dụng các file PDF. Bên cạnh việc dễ sử dụng, chúng có thể giúp lập chỉ mục bởi các tài liệu này chứa thông tin dữ liệu, liên kết, nội dung lập chỉ mục và các thuộc tính tác giả.

    1. Dễ tạo

    PDF rất hữu ích cho các nhà tiếp thị đặc biệt là đối với các nhóm nhỏ hoặc hạn chế về nhân lực. Chúng dễ dàng để được tạo ra – chỉ cần lưu tài liệu của bạn từ Word, Illustrator… sang một file PDF. Thông cáo báo chí, tài liệu nghiên cứu, dữ liệu sản phẩm và nhiều hơn nữa có thể nhanh chóng được chuyển đổi sang định dạng cơ bản. Đối với những người không biết kiến thức lập trình HTML, PDF, với nhiều loại tài liệu nhất định có thể nhanh chóng xuất bản nội dung trên web.

    2. Chứa siêu dữ liệu

    PDF cũng chứa siêu dữ liệu, cũng giống như các thẻ keyword và thẻ descriptions. Bạn có thể tìm và chỉnh sửa thông tin các thẻ dưới Properties trong menu File của Adobe Acrobat. Trong khi siêu dữ liệu không tác động lớn đến SEO nhưng tôi nghĩ rằng thẻ mô tả như một cơ hội để buộc một người tìm kiếm lựa chọn trang web của bạn trong SERPs và tôi muốn viết thẻ mô tả của riêng tôi hơn là để công cụ tìm kiếm chọn nó cho tôi.

    [​IMG]

    3. Chứa các liên kết

    Giống như các trang web, các file PDF cũng có thể chứa các liên kết và các liên kết có thể được follow bởi bots của công cụ tìm kiếm. Các liên kết này có thể chứa anchor text khá tốt.

    4. Lập chỉ mục nội dung

    Có lẽ chuyên nghiệp và hấp dẫn nhất khi sử dụng các file PDF là nội dung trong PDF thường có thể đọc được và được lập chỉ mục bởi công cụ tìm kiếm. Tuy nhiên, không phải tất cả các file có nội dung đều có thể đọc được. Để đảm bảo rằng các văn bản có thể đọc được thì nó cần phải được tạo ra dưới dạng văn bản không phải là một hình ảnh, lý tưởng nhất để tạo ra các file PDF từ các chương trình có nguồn gốc như Word hoặc Illustrator.

    5. Ứng dụng quyền tác giả

    Cũng giống như các trang HTML, tác giả có thể được nhận biết và suy ra bằng Google cho các file PDF. Tuy nhiên, với các trang HTML, tác giả sẽ chỉ được hiển thị khi họ được liệt kê ở đầu tiên. Vì vậy, điều quan trọng là phải đảm bảo rằng tất cả các tác giả được ưa thích sẽ được liệt kê đầu tiên. Ngoài ra, PDF còn có “đóng góp” rất lớn cho các trang web đó là chúng được xác định trong Google+ cho tác giả đó.

    Nhược điểm khi sử dụng các file PDF

    Khi nói đến điều hướng có một số hạn chế khi sử dụng các tập tin PDF và không kiểm soát được độ dài tài liệu, nội dung trang, tổ chức tài liệu, chỉnh sửa code, đánh dấu cấu trúc và theo dõi.

    1. Thiếu điều hướng

    Một trong những mối quan tâm lớn nhất của tôi đó là nội dung phụ thuộc quá nhiều vào các file PDF thường không điều hướng được trang web. Điều này có ý nghĩa khi một người truy cập vào trang web, chúng không có cách nào để tiếp cận các trang khác trên trang web. Vì vậy, nếu để PDF xếp hạng tốt trong tìm kiếm hữu cơ và một người tìm kiếm thấy các liên kết và đến lúc làm thế nào có thể truy cập dễ dàng vào các nội dung khác trên trang web của bạn?

    2. Chiều dài của tài liệu

    Vì nó rất dễ để lưu một tài liệu như một tập tin PDF nên nó không phổ biến đến mức chia một file PDF thành nhiều tài liệu nhỏ hơn. Ví dụ trong trường hợp của một bản báo cáo chính thức, báo cáo, các file PDF có thể dao động từ một vài trang đến hàng trăm trang. Trong một số trường hợp đây không thực sự là điều lý tưởng cho SEO vì các tài liệu còn chứa nhiều văn bản và nhiều chủ đề. Điều này có nghĩa là một tài liệu PDF sẽ tương đương với một URL có thể chứa rất nhiều nội dung mà bình thường có thể được chia thành nhiều trang web trong HTML.

    3. Thiếu tổ chức/kiểm soát trang

    Một trong những lợi ích lớn nhất của việc sử dụng một hệ thống quản lý nội dung cho một trang web đó là tổ chức và kiểm soát trang. Tuy nhiên, các file PDF không thường xuyên làm việc trong cơ cấu tổ chức của CMS như các trang mà cần phải tải xuống. Vì vậy, dựa vào các file PDF thay cho nội dung trang thì đây không phải là điều lý tưởng từ góc độ tổ chức và kiểm soát trang.

    4. Thiếu khả năng chỉnh sửa code

    Một trong những lợi ích của các trang HTML đó là sự linh hoạt khi chỉnh sửa code trang web. Ví dụ, hình ảnh có thể được tối ưu cho công cụ tìm kiếm thông qua các thẻ và các tùy chọn khác trong HTML nhưng hình ảnh không thể được tối ưu trong một file PDF. Điều này cũng làm cho các file PDF ít lý tưởng hơn bởi bạn không thể thêm một thẻ “alt” vào mỗi hình ảnh trong tập tin PDF.

    5. Không thể đánh dấu cấu trúc

    Đánh dấu cấu trúc và rich snippets được chứng minh qua các nghiên cứu khác nhau có thể cải thiện khả năng hiển thị trong SERP và tỷ lệ nhấp chuột trong tìm kiếm hữu cơ. Nhưng file PDF không làm việc theo cách giống như HTML – tác giả không thể áp dụng bằng cách đánh dấu cấu trúc đến nội dung vì cách phân loại các tập tin PDF đang hoạt động.

    Theo dự đoán của tôi, đó là một bất lợi thực sự của file PDF. Ví dụ, nếu PDF của bạn có chứa những công thức nấu ăn, bạn sẽ không thể sử dụng để đánh dấu cấu trúc xung quanh qua những công thức nấu ăn. Do đó, nó không chứa những công thức nấu ăn và ngăn chặn những công thức nấu ăn hiển thị trong công thức rich snippets.

    6. Thiếu cơ chế theo dõi

    Tôi nhận thấy những bất lợi lớn khi sử dụng các file PDF là thiếu cơ chế theo dõi khi áp dụng cho các tài liệu PDF. Google Analytics có thể thực hiện thông qua việc theo dõi sự kiện onclick để tải về tập tin PDF. Ngoài ra, có thể có cơ chế theo dõi khác mà trang web của bạn đang sử dụng chẳng hạn như hệ thống tự động hóa tiếp thị. Mã theo dõi cho các hệ thống này cũng sẽ không thể được thêm vào các file PDF.

    Không giống như các trang HTML, PDF làm cho nó khó khăn hơn nhiều khi người truy cập vào trang web của bạn.

    Kết luận

    Rõ ràng các file PDF không phải là lựa chọn tốt nhất dành cho SEO. Điều này không có nghĩa là chúng có hại cho SEO mà chúng chỉ đơn giản là các Webmaster không thể kiểm soát được chúng. Để nhận ra những lợi ích lớn nhất từ SEO, nếu có thể tôi khuyên bạn nên chuyển nội dung từ PDF sang các trang web HTML để các webmaster dễ dàng kiểm soát hơn, linh hoạt hơn và tạo ra cơ hội tốt nhất cho SEO và mở rộng khả năng hiển thị và lợi thế theo dõi.

    - Ghi rõ nguồn www.thegioiseo.com khi đăng tải bài viết này.
    - Bài viết có sử dụng nội dung của tác giả Janet Driscoll Miller (SEL).
    - Link bài: Ưu nhược điểm của các file PDF trong SEO.
Tags: ưu điểm, file, pdf, seo

Chia sẻ trang này