Nội dung chính
Machine Learning là gì? Đó là một con đường “giải phóng” của con người, giúp con người giải phóng đầu óc, không cần phải ngày nào cũng làm đi làm lại những công việc vô tri như nhau, hay còn gọi là “Làm việc như cái máy”. Đồng thời, do công việc trong thời đại ngày nay ngày càng phức tạp, độ tải cao, Machine Learning chính là phương án tối ưu hóa năng suất cho con người.
Để hiểu thêm về Machine Learning là gì, điều gì quan trọng nhất đối với một mô hình Machine Learning ưu việt cũng như những tố chất cần thiết của một người làm việc với Machine Learning là gì, ITviec đã có buổi phỏng vấn với Lê Hữu Long – Machine Learning Project Manager tại Cinnamon AI – Công ty Machine Learning từ Nhật Bản – Top 6 Vietnam Best IT Companies 2020.
Bài viết được thực hiện dưới góc nhìn và thông tin của anh Lê Hữu Long.
Machine Learning là gì?
Machine Learning cơ bản là một mô hình có khả năng “học tập” một lượng lớn dữ liệu, đọc được những khuôn mẫu (pattern) trong dữ liệu và thực hiện một nhiệm vụ nào đó, có thể là đưa ra những phân loại, dự đoán. Có thể hiểu đơn giản là giống như cách con người học, “máy học” cũng là quá trình huấn luyện máy tính dựa trên những dữ liệu, khuôn mẫu đã có nhằm hoàn thành một công việc trong tương lai một cách tốt hơn mà con người không cần thủ công can thiệp.
Vậy thì, mô hình máy học nào sở hữu lượng dữ liệu lớn hơn để “học” thì sẽ tiên tiến hơn, độ chính xác khi thực hiện nhiệm vụ sẽ cao hơn. Machine Learning gần như là cuộc đua về dữ liệu, không phải cuộc đua về thuật toán. Long còn ví von dữ liệu như là một loại “dầu thô” mới trong ngành Machine Learning mà ai cũng muốn sở hữu càng nhiều càng tốt.
Cũng chính vì thế mà một trong những hạn chế lớn nhất để đạt kết quả tốt nhất trong quá trình “máy học” chính là sự thiếu hụt về dữ liệu đầu vào, đặc biệt là nếu đó không phải là in-house Machine Learning team. Bởi vì không có toàn quyền truy cập vào cơ sở dữ liệu, nhất là những dữ liệu mang tính cá nhân, độ bảo mật cao, các công ty Machine Learning outsourcing sẽ khó có thể dựng mô hình “máy học” một cách tốt nhất.
Tuy nhiên, không phải dữ liệu nào cũng đủ chất lượng để đưa vào máy học. Dữ liệu đó phải được qua công đoạn “làm sạch”, dán nhãn để máy có thể học tốt được. “Garbage in, garbage out” – Long nhấn mạnh về tầm quan trọng của việc “lọc” dữ liệu trước.
Mối quan hệ của Data Science và AI với Machine Learning là gì?
AI là “trí tuệ nhân tạo”, nhằm tạo ra những bộ máy có khả năng mô phỏng khả năng suy nghĩ và hành vi của con người. Một hệ thống sử dụng AI có nghĩa rằng hệ thống đó không cần phải được lập trình trước mà cần những thuật toán có thể tự làm việc với nhau.
Những ứng dụng phổ biến của AI mà ta có thể nhận thấy chính là Siri, Google, AI trong chơi cờ,… Machine Learning chính là cách tiếp cận để đạt được AI. Machine Learning là một nhánh nhỏ, một tập con của AI và AI cho phép máy móc học hỏi từ dữ liệu mà không cần được lập trình một cách rõ ràng.
Xem thêm: AI là gì? do AI Engineer tại Viettel R&D giải đáp
Data Science là một quá trình “khám phá” các khuôn mẫu dữ liệu từ dữ liệu thô và có nhiệm vụ giải thích, đưa ra dự đoán từ những khuôn mẫu đó. Data Science gồm nhiều công đoạn và công việc cần phải xử lý, từ việc thu thập dữ liệu, tinh gọn dữ liệu, lưu trữ dữ liệu,…
Machine Learning là giai đoạn sau của Data Science. Sau khi tất cả dữ liệu đã sẵn sàng để được xử lý thì đưa vào mô hình máy học để đưa ra khuôn mẫu, dự đoán. Việc thu thập một lượng dữ liệu vừa lớn vừa đủ “sạch” mới là thách thức của Data Science.
Giải đáp cặn kẽ Big Data là gì? và Data Scientist là ai?
Khi hiểu được Machine Learning là gì, bạn sẽ thấy “máy học” là sợi dây liên kết giữa Data Science và AI. Dựa vào những dữ liệu từ Data Science, AI chính là “kết quả” thu về được, chính là mục đích cho những tập dữ liệu đó và giải quyết được những vấn đề cụ thể được đặt ra. Và Machine Learning là sự liên kết, “công cụ” để đạt kết quả đó.
Thực trạng hiện nay của Machine Learning là gì?
Thực trạng Machine Learning trên thế giới
Một trong những thực trạng AI nói chung, Machine Learning nói riêng, đang phổ biến trên thế giới hiện nay chính là “Black box AI”. Anh Long giải thích Black box AI có nghĩa:
Mình là người xây dựng thuật toán, mình huấn luyện máy, mình kiểm tra kết quả nhưng đôi khi mình lại không hiểu hết được điều gì đã xảy ra bên trong quá trình “học” đó. Và đó cũng giống như là “hộp đen” của giới AI vậy đó.
Hiện nay, thế giới họ đang muốn hướng đến “White box AI”, có nghĩa là con người sẽ thấu suốt được tất cả những gì đang xảy ra trong lúc máy học. Tuy nhiên, điều này lại dẫn đến một mâu thuẫn rằng “Nếu con người hiểu hết rồi, thì còn cần gì máy nữa?”. Câu hỏi này sẽ được giải đáp ở mục 3. Mối quan hệ của AI và con người ngay dưới đây.
Thực trạng Machine Learning ở Việt Nam
Long cũng chia sẻ rằng xu hướng Machine Learning phát triển ở Việt Nam cũng chưa thật sự rõ ràng. Để lý giải điều này, anh cho rằng thực trạng này diễn ra với nguyên nhân chính nằm ở chỗ chi phí.
Mục đích AI được sinh ra là để giảm bớt chi phí và hỗ trợ những công việc mang tính “tay chân”, lặp đi lặp lại. Ở thị trường nước ngoài, chi phí cho những công việc đó sẽ rất cao nhưng ở Việt Nam thì chi phí lại khá thấp, nên vẫn chưa cần thiết tìm đến một giải pháp thay thế.
Tuy nhiên, những người làm việc trong ngành AI cũng nên luôn trong trạng thái, sẵn sàng để học hỏi và phát triển bản thân. Nếu trong trường hợp, có một cơ hội hiếm khi xuất hiện diễn ra, vẫn có đủ nhân lực sẵn sàng cho nhiệm vụ đó và đó sẽ là một lợi thế lớn khi mình đi trước những người không chuẩn bị. Long đưa ví dụ trực quan, dễ hiểu:
Trong khoảng thời gian cuối năm 2020 và quý 1/2021, thị trường chứng khoán chứng kiến một sự gia tăng “đột biến” trong việc đăng ký tài khoản chứng khoán mà chưa từng có tiền lệ.
Hầu hết tất cả các công ty chứng khoán đều yêu cầu khách hàng của họ phải ra tận văn phòng để đăng ký tài khoản. Duy nhất chỉ có Công ty Cổ phần Chứng khoán VPS lại sử dụng eKYC – một ứng dụng phổ biến của công nghệ AI, trong việc đăng ký để nhà đầu tư có thể thực hiện tất cả mọi thao tác trên điện thoại di động.
Nhờ việc luôn chủ động trong việc cập nhật công nghệ, VPS vươn lên trở thành công ty chứng khoán có thị phần môi giới lớn nhất Việt Nam quý I/2021.
Thực trạng Machine Learning ở Việt Nam có thể mô tả bằng cụm từ “vừa thừa vừa thiếu”. Bài toán cần giải rất nhiều, vì Việt Nam đương nhiên cũng sẽ gặp những vấn đề tương tự như trên thế giới, có thể ở quy mô nhỏ hơn, nhưng lại thiếu khả năng để giải bài toán. Chính vì thế, nhu cầu tuyển dụng Machine Learning Engineer ở Việt Nam khá cao.
Xem thêm: Cơ hội việc làm Machine Learning tại Việt Nam
Machine Learning đang là hướng phát triển trong tương lai, còn hiện tại vẫn là một sân chơi mới. Khi tiếp xúc với những khía cạnh “đã cũ” trên thế giới thì mình sẽ có nhiều bất lợi hơn lợi thế vì những sân chơi đó đã có nhiều ông lớn thống trị.
Chính vì thế, khi tham gia vào “sân chơi mới” như Machine Learning thì công nghệ Việt Nam vẫn sẽ có cơ hội ngang bằng với tất cả mọi người, bắt đầu như nhau. Khó khăn vẫn có, nhưng cơ hội vẫn sẽ nhiều hơn, hãy biết nắm bắt cơ hội này. Đây cũng chính là lời khuyên và động viên mà Long dành cho những bạn muốn theo đuổi Machine Learning.
Mối quan hệ của AI và con người
Một câu hỏi lớn được đặt ra đó chính là “Con người liệu có bị thay thế bởi máy móc không?” trong khi chính chúng ta tạo ra “máy học” để giảm tải công việc cho con người.
Long cho rằng, sau khi làm việc với Machine Learning, thì người và máy sẽ theo xu hướng bắt tay nhau để làm việc, không phải là ai thay thế ai cả. Mỗi bên đều sẽ có những điểm mạnh và điểm yếu riêng mà bên còn lại có thể bổ sung.
Máy có khả năng làm việc, xử lý, học tập một lượng dữ liệu vô cùng lớn trong một khoảng thời gian kéo dài liên tục mà không cảm thấy mệt mỏi. Tuy nhiên, người lại có tư duy, sáng tạo và trực giác – những điều mà máy sẽ không có.
Machine Learning có thể đưa ra kết quả dự báo nhưng quyền quyết định vẫn thuộc về con người. Con người có thể giải nghĩa và móc nối những dữ liệu từ máy đưa ra và sẽ biết rằng mô hình này có thể dùng để giải quyết bài toán nào.
Machine Learning Project Manager trong ngành IT nói gì?
- Machine Learning và đôi lần “vỡ mộng”
Khi chỉ biết cơ bản về Machine Learning là gì, mọi người thường tưởng tượng rằng khi được làm việc trong ngành này, họ sẽ được làm rất nhiều thứ “khủng khiếp” mỗi ngày, được tiếp xúc với lượng dữ liệu khổng lồ. Long cũng không phải là ngoại lệ.
Ấy vậy mà sự thật lại trái ngược hoàn toàn. “Các bạn Engineer muốn xây dựng một mô hình mạnh nhất có thể. Data được nhận ít, không phức tạp, chỉ như là dữ liệu mẫu thôi, số lượng vài trăm” – Long chia sẻ. Còn công việc chủ yếu mỗi ngày chỉ là huấn luyện máy, quy trình lặp đi lặp lại như vậy mỗi ngày, thời gian lên đến cả tháng.
Quả nhiên không hề “vĩ đại” như những gì mỗi người hay vẽ ra về Machine Learning và AI nhỉ?
Tuy nhiên, hồi đầu thì vậy nhưng khi đã quen rồi, Long lại càng ngày càng thấy hứng thú với Machine Learning, nhận ra được nhiều khía cạnh vô cùng thú vị của công việc này.
Làm lâu rồi mình mới thấy khả năng tiếp thu dữ liệu của mô hình vô cùng ấn tượng. Mình càng huấn luyện nó, càng “dạy” nó thì mô hình càng “sáng” hơn. Cảm giác tự hào vô cùng! Khi mới tiếp xúc với dự án, lượng dữ liệu nhận được có vài trăm. Sau đó, lại được tiếp cận với hàng chục triệu mẫu dữ liệu khác nhau, mình phải thốt lên “Ồ quao, thú vị đấy!” (cười). Dữ liệu càng lớn đương nhiên là càng vui rồi!
Và đặc biệt hơn nữa chính là khi làm lâu rồi, mình được tiếp cận những mã dữ liệu khác nhau từ nhiều khách hàng khác nhau. Từ đó, mình nhìn thấy được sự liên quan của những khách hàng chung một tệp/ngành, hiểu được “nỗi đau” của họ, mình có thể tự động đưa ra những đề xuất mà khách còn không yêu cầu. Như vậy là quá hạnh phúc rồi.
Cảm ơn Long vì những chia sẻ về nghề vô cùng chân thật và nhiều thông tin hữu ích.
Với những thông tin trên, bạn hoàn toàn có thể thấy Machine Learning không quá khó hiểu hay “huyền bí” như mọi người vẫn hay đồn đại, việc định nghĩa Machine Learning là gì cũng dễ dàng hơn.
Như đã có chia sẻ về “thực trạng Machine Learning tại Việt Nam”, hiện nay, cơ hội dành cho những vị trí nghề nghiệp liên quan đến Machine Learning vẫn đang mở rất nhiều trên thị trường. Để biết thêm về những vị trí đó và tìm thêm cơ hội cho mình, bạn có thể đọc ngay bài viết Những vị trí liên quan đến Machine Learning cơ bản.
Tiểu sử:
Long tốt nghiệp ngành Kinh Tế – Tài chính Doanh nghiệp. Khi ra trường, vào năm 2014, bạn làm vị trí Consultant and deploy tại công ty FPT IS. Công việc chính của Long khi đó là tư vấn và triển khai hệ thống ERP – quản lý nguồn lực doanh nghiệp, module quản lý sản xuất .
Sau đó, vào các năm 2015 và 2017, Long công tác tại Viet Capital Bank và TRG International trong vai trò Business Development Executive.
Bây giờ, vị trí của Long là Project Manager tại Cinnamon AI. Tính đến tháng 4/2021, Long đã gắn bó với công ty được hơn 2 năm.
Ngoài ra, Long cũng có một side project khá thú vị là dịch vụ cho thuê sách online theo hình thức subscription Libri reading tại website: librireading.com
Bạn thấy bài viết hay và cần thiết với nhiều người? Đừng ngại nhấn nút Share bên dưới nhé.