Trí Tuệ Nhân Tạo | Podcast - Nhac.vn

Trí Tuệ Nhân Tạo
Trí Tuệ Nhân Tạo
trituenhantao.io
Claim ownership
Giới thiệu
Podcast chính thức của trituenhantao.io, nơi chia sẻ thông tin, kiến thức, kinh nghiệm học tập và triển khai các chương trình và dự án sử dụng trí tuệ nhân tạo trên thế giới.
Có mặt tại
Cộng đồng
42 podcasts
LLM ngày càng trở nên mạnh mẽ nhưng liệu nó có dừng bước trước logic
06ph
03 Thg12, 25
Phần trọng tâm của báo cáo tập trung vào việc áp dụng các công cụ AI, xác định các nhiệm vụ pháp lý thường ngày được thực hiện bằng AI, như soạn thảo và xem xét tài liệu, đồng thời phác thảo những thách thức, cơ hội và mối quan tâm liên quan đến việc sử dụng AI. Cuối cùng, nó còn xem xét các xu hướng và triển vọng tương lai của AI trong ngành luật, bao gồm cả thái độ tích cực của người dùng AI thường xuyên.
14ph
23 Thg11, 25
Tài liệu này giới thiệu về DeepScientist, một hệ thống agent dựa trên mô hình ngôn ngữ lớn (LLM) được thiết kế để tự động hóa quá trình khám phá khoa học, bao gồm việc tạo ý tưởng, thực hiện thử nghiệm và viết báo cáo nghiên cứu. Hệ thống này mô hình hóa nghiên cứu khoa học như một bài toán Tối ưu hóa Bayesian nhằm tìm ra các phương pháp mới vượt qua hiệu suất State-of-the-Art (SOTA) hiện tại. Các thử nghiệm chỉ ra rằng DeepScientist đạt được những tiến bộ tương đương với nhiều năm nghiên cứu của con người chỉ trong vòng hai tuần, đồng thời liên tục vượt trội hơn các phương pháp do con người thiết kế trên nhiều lĩnh vực như phát hiện văn bản AI và tăng tốc suy luận LLM. Tuy nhiên, các nhà nghiên cứu nhấn mạnh rằng tính chính trực trong học thuật là tối quan trọng, do đó họ sẽ không công khai mô-đun phân tích và báo cáo để đảm bảo con người vẫn phải giám sát và chịu trách nhiệm cuối cùng cho các kết quả khoa học do AI tạo ra.
16ph
17 Thg10, 25
Nghiên cứu sử dụng metric pass@k để đo lường ranh giới khả năng suy luận trên nhiều bài kiểm tra toán học, lập trình và suy luận hình ảnh. Kết quả cho thấy RLVR chủ yếu tăng cường hiệu quả lấy mẫu các con đường suy luận đúng đã tồn tại trong mô hình cơ sở, nhưng không tạo ra khả năng suy luận mới và thậm chí còn giảm phạm vi bao phủ các vấn đề có thể giải quyết ở các giá trị k lớn.
06ph
04 Thg05, 25
"Attention Is All You Need" (2017) là cột mốc mở ra kỷ nguyên của các mô hình ngôn ngữ lớn (LLM) hiện đại như GPT, BERT, Claude, Gemini hay LLaMA.Đọc thêm: https://trituenhantao.io/tin-tuc/minh-hoa-transformer/
08ph
04 Thg05, 25
Bài viết giới thiệu DeepSeek-R1, một mô hình ngôn ngữ lớn thế hệ mới được phát triển thông qua học tăng cường (RL) để nâng cao khả năng suy luận. Mô hình đầu tiên, DeepSeek-R1-Zero, được huấn luyện chỉ bằng RL và cho thấy khả năng suy luận ấn tượng, nhưng gặp vấn đề về tính dễ đọc. DeepSeek-R1 giải quyết những vấn đề này bằng cách kết hợp huấn luyện đa giai đoạn và dữ liệu khởi tạo trước RL, đạt hiệu suất suy luận ngang ngửa với OpenAI-o1-1217 trên các điểm chuẩn. Ngoài ra, các nhà nghiên cứu đã công khai các mô hình nhỏ hơn được tinh chỉnh từ DeepSeek-R1, chứng minh hiệu quả của việc tinh chỉnh khả năng suy luận từ các mô hình lớn hơn.
07ph
02 Thg05, 25
Bài báo nghiên cứu sử dụng mạng thần kinh sâu với cơ chế chú ý để cải thiện việc tìm kiếm tài liệu pháp lý. Các tác giả đề xuất một phương pháp tiếp cận chung sử dụng mạng thần kinh sâu có cơ chế chú ý và phát triển hai kiến trúc phân cấp: Attentive CNN và Paraformer, để biểu diễn các văn bản pháp luật dài.
06ph
02 Thg05, 25
Vào ngày 20/01/2025, công ty công nghệ AI Trung Quốc DeepSeek đã ra mắt mô hình AI mang tính cách mạng DeepSeek R1. Chỉ sau vài ngày, R1 đã nhanh chóng trở thành ứng dụng được tải xuống nhiều nhất trên App Store tại Mỹ, vượt mặt cả những ông lớn như ChatGPT. Thành công này không chỉ làm rúng động thị trường công nghệ mà còn gây ra một đợt bán tháo cổ phiếu (selloff) lớn trên thị trường chứng khoán.
01ph
01 Thg02, 25
Agentic AI đang định hình lại cách chúng ta nhìn nhận trí tuệ nhân tạo, từ khả năng phân tích dữ liệu đến khả năng tự hành động độc lập, mở ra kỷ nguyên mới cho các ứng dụng công nghệ.
01ph
26 Thg11, 24
Trong thời đại kỹ thuật số hiện nay, học máy (Machine Learning) không chỉ là lãnh địa dành riêng cho các lập trình viên hay những người đam mê công nghệ. Công nghệ này thậm chí còn mở rộng tầm ảnh hưởng của mình ra khắp các lĩnh vực khác nhau. No Code Machine Learning (Học máy không cần viết mã) đã nhanh chóng trở thành một phần không thể thiếu trong nhiều ngành nghề và mở ra vô số cơ hội mới cho mọi người.
01ph
29 Thg08, 24