Perplexity Deep Research nâng cấp với Claude Opus 4.5
Perplexity vừa tung ra bản nâng cấp Deep Research chạy trên nền tảng Claude Opus 4.5 của Anthropic, đồng thời công bố điểm chuẩn DRACO cho thấy họ đã vượt qua cả Google Gemini và OpenAI trong các tác vụ nghiên cứu chuyên sâu.

Perplexity vừa chính thức công bố vào thứ Tư (4/2) bản nâng cấp toàn diện cho công cụ Deep Research. Điểm nhấn của lần cập nhật này là việc tích hợp mô hình ngôn ngữ mạnh nhất hiện nay của Anthropic - Claude Opus 4.5 - kết hợp với hạ tầng tìm kiếm và sandbox độc quyền của Perplexity.

Không chỉ dừng lại ở nâng cấp phần mềm, Perplexity còn thách thức cả giới công nghệ khi ra mắt DRACO - một bộ tiêu chuẩn đánh giá mã nguồn mở mới. Kết quả đo lường cho thấy Perplexity Deep Research đạt điểm số 67,15%, vượt xa Google Gemini Deep Research (58,97%) và OpenAI Deep Research (52,06%), khẳng định vị thế dẫn đầu trong mảng tìm kiếm học thuật và chuyên sâu.

Đơn vị: Trung tâm HTKN đổi mới sáng tạo Đà Nẵng & MPR Cập nhật: 13.02.2026 10:20 (Giờ VN)

1. "So What?" – Tại sao sự kết hợp này lại quan trọng?

Đây là bước đi chiến lược định vị lại Perplexity từ một công cụ "hỏi đáp nhanh" thành một "trợ lý nghiên cứu" đáng tin cậy:

  • Sức mạnh cộng hưởng (Synergy): Perplexity giỏi tìm kiếm (Search), Claude Opus 4.5 giỏi tư duy và viết lách (Reasoning & Writing). Sự kết hợp này giải quyết được điểm yếu lớn nhất của các mô hình tìm kiếm cũ: Tìm được thông tin nhưng không biết tổng hợp và phân tích sâu.
  • Tiêu chuẩn mới DRACO: Khác với các bài test truyền thống chỉ hỏi mẹo hay đố vui, DRACO đánh giá dựa trên 100 tác vụ thực tế trong 10 lĩnh vực (Luật, Y tế, Tài chính...). Việc Perplexity dẫn đầu trong lĩnh vực Luật (86%) và Học thuật (80,2%) cho thấy độ tin cậy cực cao cho giới chuyên môn.
  • Nhanh và Chuẩn: Perplexity không chỉ chính xác hơn mà còn nhanh hơn. Thời gian phản hồi trung bình là 459,6 giây cho một bài nghiên cứu sâu - mức thấp nhất trong số các công cụ được thử nghiệm. Trong kinh doanh, tốc độ ra quyết định chính là tiền bạc.

2. Góc nhìn MPR: Minh bạch hóa cuộc chơi

Góc nhìn MPR (Phân tích Chiến lược):

Perplexity đang chơi một ván bài rất khôn ngoan: "Open Source" (Mã nguồn mở) bộ tiêu chuẩn đánh giá của mình.

  • Thách thức đối thủ: Bằng cách công khai phương pháp luận và dữ liệu của DRACO lên Hugging Face, Perplexity đang nói với Google và OpenAI rằng: "Hãy dùng thước đo này mà so sánh". Nếu các đối thủ không thể đánh bại Perplexity trên chính sân chơi này, họ sẽ mất đi vị thế "State-of-the-Art" (SOTA).
  • Thoát mác "Wrapper": Nhiều người từng chỉ trích Perplexity chỉ là lớp vỏ (wrapper) của GPT. Với việc tự xây dựng hạ tầng Deep Research và phối hợp đa mô hình, Perplexity chứng minh họ là một nền tảng nghiên cứu độc lập và mạnh mẽ, được Microsoft hậu thuẫn (qua deal đám mây 750 triệu USD).

3. Ứng dụng cho Giới Nghiên cứu tại Đà Nẵng

Cộng đồng học thuật và doanh nghiệp Đà Nẵng có thể hưởng lợi ngay lập tức:

  • Đại học & Viện nghiên cứu: Giảng viên và sinh viên Đại học Đà Nẵng có thể sử dụng Perplexity Deep Research để tổng hợp tài liệu (Literature Review) với độ chính xác cao hơn hẳn Google Scholar truyền thống, đặc biệt là các ngành Y Dược và Luật pháp quốc tế.
  • Startups xây dựng RAG: Các đội ngũ kỹ thuật tại Đà Nẵng đang xây dựng ứng dụng AI (RAG Apps) nên tải bộ dataset DRACO về để tự đánh giá (benchmark) sản phẩm của mình. Đây là bộ tiêu chuẩn vàng mới để đo lường độ chính xác của AI khi trích xuất thông tin.

Góc nhìn từ Trung tâm HTKNĐMST Đà Nẵng:

"Sự ra đời của DRACO và Deep Research mới là tin vui cho những người làm việc dựa trên dữ liệu. Thay vì tin tưởng mù quáng vào AI, giờ đây chúng ta có công cụ để kiểm chứng độ chính xác. Chúng tôi khuyến khích các startup Đà Nẵng tận dụng công cụ này để nâng cao chất lượng nghiên cứu thị trường và đối thủ cạnh tranh."


Nguồn tham chiếu (Sources):

  • [1] Sentinel Assam: Perplexity upgrades Deep Research to reach SOTA performance (05.02.2026)
  • [2] Perplexity Paper: Chi tiết kỹ thuật về DRACO Benchmark và kết quả so sánh.
  • [3] Hugging Face: Bộ dữ liệu DRACO được công bố mã nguồn mở.

Bạn tin tưởng công cụ nào nhất khi cần tra cứu thông tin chuyên sâu?

P G C
1.820 lượt bình chọn