Một chiếc trực thăng đỏ rực bay thấp trên một ngôi làng nhỏ dưới chân núi Mont Blanc, kéo theo một quả cầu kim loại lớn treo lủng lẳng bên dưới. Đó không phải là một màn trình diễn được cho phép trước. Nhưng với niềm đam mê mãnh liệt muốn thay đổi cách chúng ta quan sát và nghiên cứu thế giới, nhà khoa học Renaud Keriven đã dám mạo hiểm. Khối tròn này chứa 25 máy ảnh – một hệ thống chụp ảnh tạm bợ nhằm bắt trọn mọi khía cạnh của ngôi làng trong vài phút ngắn ngủi. Từ kế hoạch táo bạo đó cùng một tuần xử lý máy tính cật lực, một mô hình 3D chi tiết đã ra đời. Sự phấn khích của Keriven khi ấy cũng chính là khởi đầu của kỷ nguyên “capture thực tế” trong xây dựng hạ tầng. Ngày nay, ông là kỹ sư trưởng tại Bentley Systems, công ty phần mềm nổi tiếng cho ngành kỹ thuật hạ tầng, tiếp tục sứ mệnh dạy máy móc nhìn và mô hình hóa thế giới 3D.

Bước ngoặt từ thị giác máy tính đến công nghệ Photogrammetry

Sinh ra trong một gia đình lao động vào năm 1966, Keriven là người đầu tiên trong nhà được học hành chính quy. Tài năng toán học đã đưa ông vào École Polytechnique – đỉnh cao của giáo dục kỹ thuật Pháp, rồi chuyên sâu vào toán ứng dụng, nhận diện mẫu và thị giác máy tính tại École des Ponts ParisTech. Đầu thập niên 90, giấc mơ lớn của thị giác máy là hỗ trợ khám phá vũ trụ. “Để đưa Rover lên Sao Hỏa, cần một hệ thống tự động với khả năng thị giác mạnh mẽ,” Keriven chia sẻ. Ông cùng các đồng nghiệp đã biến lý thuyết toán học không gian thành thuật toán thực tế, giúp máy móc xác định độ sâu, cấu trúc và khoảng cách qua hình ảnh.

Một đột phá lớn là giúp máy học cách nhìn hai ảnh lệch góc rồi xác định vị trí 3D của điểm trong không gian – chẳng khác gì cách con người cảm nhận độ sâu. Từ đây, khoa học photogrammetry – trích xuất dữ liệu 3D từ ảnh 2D – bắt đầu định hình, dần trở thành nền tảng số hóa không gian hạ tầng ngày nay.

Đưa công nghệ ra thực địa lớn

Trước kỷ nguyên số hóa đô thị, hai cộng đồng khác biệt đang miệt mài trích xuất hình dạng từ ảnh: Các phòng lab đại học, nơi mọi thứ được kiểm soát, và các kỹ sư khảo sát thực địa – lấy ảnh chồng lắp và xác định điểm chung bằng tay. Khi sức mạnh máy tính tăng lên, Keriven mở rộng quy mô từ vật thể nhỏ sang cảnh thật ngoài trời: khinh khí cầu lớn 5m chứa máy ảnh trị giá 50.000 euro được đưa lên độ cao 150m ở một tu viện cổ tại Pháp – tạo nên mô hình 3D chuẩn xác chưa từng có.

Mô hình 3D trắng đen của một quần thể kiến trúc lịch sử với nhiều toà nhà, mái vòm và tháp chính khi nhìn từ trên xuống, thể hiện cách máy móc nhìn thế giới 3D để tái tạo thực tế.
Mô hình 3D tu viện tạo ra bằng bóng khí và máy ảnh.

Tiếp theo là thử nghiệm bằng trực thăng, có thể kể đến là mô hình ngọn núi Aiguille du Midi nhìn xuống Chamonix.

Ảnh ghép hiển thị mô hình 3D một ngọn núi với hình ảnh chồng lắp, làm nổi bật việc tái dựng thực tế sử dụng thị giác máy tính 3D; có trực thăng đỏ trên tuyết và logo Imagine, Ecole des Ponts ParisTech, CSTB, Bernard Vallet.
Mô hình 3D Chamonix chụp từ trực thăng.

Lập nên Acute3D và thay đổi ngành

Khi máy ảnh số và drone trở nên phổ biến, khả năng capture thực tế đã tăng tốc thần tốc. Năm 2011, Keriven cùng học trò Jean-Philippe Pons thành lập Acute3D tại Sophia Antipolis và Paris – thực chất bắt đầu với khoản vốn tiết kiệm “kiểu garage.” Dù có phần mơ mộng, công nghệ phần mềm của họ – Smart3DCapture – lại nhanh chóng phổ biến toàn cầu, giúp chuyển đổi bộ ảnh kỹ thuật số thành lưới 3D thực tế sắc nét, khả dụng cho kỹ sư. Từ công trình nhỏ tới quy mô thành phố, các mô hình 3D của Acute3D dần trở thành tiêu chuẩn trong xây dựng, khai khoáng, viễn thông, thậm chí là giải đua Công thức 1.

Đội ngũ non trẻ nhận ra: phát triển nhanh hoặc sẽ bị đào thải. Thay vì gọi vốn đầu tư, Keriven chọn bán lại toàn bộ cho Bentley Systems năm 2015 – nơi ông có thể tiếp tục phát triển công nghệ cùng tầm nhìn lan tỏa rộng hơn. Đó là bước ngoặt giúp phần mềm của họ tiến hóa thành ContextCapture, rồi iTwin Capture – “bộ não” của nền tảng iTwin cho mô hình số hạ tầng hiện nay.

Nền tảng bứt phá: Từ máy học đến chuẩn mở 3D Tiles

Tại Bentley, ông Keriven chuyển hướng mạnh sang machine learning – tự động nhận diện, gán nhãn các đối tượng như cột ăng-ten, biển báo, vết nứt hay hàng cây trên mô hình 3D. Ý tưởng là mô hình không chỉ nhìn thấy và đo đạc, mà giờ còn “tìm kiếm” và phân tích. Machine learning còn giúp nhận diện thay đổi theo thời gian – tự động phát hiện công trình mới, hư hỏng hoặc xuống cấp, hỗ trợ cập nhật mô hình số.

Một thách thức là truy cập mượt mà mô hình 3D quy mô lớn. Acute3D từng phát triển kỹ thuật “streaming” thông minh: chỉ tải đúng khu vực cần thiết, độ phân giải phù hợp với từng vị trí chuột của người dùng. Tầm quan trọng của khả năng này khiến Bentley tích hợp bạn ấy vào MicroStation chỉ trong ba tuần!

Sau đó, Keriven phát hiện tiềm năng chuẩn 3D Tiles từ Cesium – lúc ấy là một startup còn non trẻ chuyên làm visualization 3D quy mô lớn trên nền web. Nhờ sự cởi mở và hiệu quả của chuẩn này, Bentley đã chuyển đổi sang 3D Tiles, biến nó thành xương sống iTwin Platform. Đặc biệt, năm 2024 Bentley đã mua lại Cesium, càng thúc đẩy chuẩn này trên quy mô toàn cầu.

Kỷ nguyên “splatting” Gaussian mở ra

Công nghệ reality capture lại bước sang trang mới với “Gaussian splatting” – một kỹ thuật đồ họa 3D nổi lên gần đây nhưng nhanh chóng gây tiếng vang. Toàn bộ ý tưởng dựa trên xác suất hình chuông của Gauss thế kỷ 18, áp dụng để tạo ra “splat” – các ellipsoid trong suốt xếp chồng lớp, mô phỏng bề mặt thực một cách ấn tượng. Ưu điểm vượt trội của splatting là xử lý được chi tiết cực nhỏ (dây cáp, ăng-ten, giàn giáo, tán cây…), giúp mô hình 3D hạ tầng thực tế và chính xác hơn mesh truyền thống.

Bentley đã ra mắt công cụ streaming splat cho các dự án nhỏ, dự kiến sẽ mở tới quy mô thành phố lớn cuối 2025. Tuy nhiên, để “splat” thật sự phát huy và kết nối với chuẩn khác, Keriven cùng Cesium đang gấp rút chuẩn hóa định dạng splat qua nhóm Khronos – nhằm đảm bảo tính mở và khả năng tích hợp rộng rãi trên mọi nền tảng.

Một nút bấm để lập bản đồ thế giới

Khi được hỏi về tương lai, Keriven không ngần ngại: “Tự động hóa hoàn toàn! Tôi muốn capture thực tế chỉ bằng một nút bấm: drone sẽ tự bay, tự chụp, trả về ngay trên cloud mọi thứ – mesh, splat, nhãn machine learning…” Xa hơn nữa, ông mơ về một mô hình số sống động của toàn cầu, liên tục cập nhật bởi cộng đồng người dùng – một “Google Earth” thực tế, có thể xây dựng từ mọi nơi trên Trái đất. Theo ông, rào cản hiện nay là yêu cầu phải có chuyên gia dựng mô hình 3D chất lượng. Ông quyết tâm xóa bỏ rào cản này để 3D thành công cụ phổ biến cho mọi ngành hạ tầng.

Với Renaud Keriven, mục tiêu cuối cùng không chỉ là những mô hình 3D tốt hơn, mà là một thế giới hữu hình, dễ tiếp cận hơn với tất cả mọi người.

Bạn đang tìm kiếm giải pháp dựng mô hình 3D thực tế, hiện đại cho hạ tầng hoặc dự án xây dựng? Liên hệ ngay với đội ngũ MICAD để nhận tư vấn chi tiết về các giải pháp số hóa không gian, thực tế ảo và ứng dụng AI – từ chụp ảnh thực tế (reality capture), mô hình số, đến streaming splat 3D thế hệ mới. Chúng tôi đồng hành giúp doanh nghiệp tối ưu vận hành, bảo trì, theo dõi tình trạng công trình hoặc dự án đô thị – công nghiệp… Đăng ký nhận báo giá nhanh chóng tại https://micad.vn/bao-gia/ để khởi động bước chuyển đổi số hạ tầng hôm nay!