Tổng quan về ngành Data Analytics
Định nghĩa và bản chất công việc Data Analytics
Data Analytics (hay Phân tích dữ liệu) là việc tra soát, chọn lọc, phân tích dữ liệu thô (thường có số lượng rất lớn) nhằm đưa ra những kết luận, thông tin chắt lọc (key insight) có ý nghĩa. Bản chất công việc Data Analytics nằm ở việc phân tích và suy luận: rút ra kết luận chỉ dựa trên những dữ liệu thô và thông tin sẵn có.Để thực hiện được việc phân tích và suy luận, Data Analytics cần đến sự giúp đỡ (thực chất là áp dụng) của rất nhiều thuật toán, mô hình hoặc có thể là quy trình cơ học khác nhau có sẵn để thu được những key insight, ví dụ như: xu hướng, mối tương quan lẫn nhau giữa các nhóm dữ liệu… Tóm lại, phân tích và suy luận là công việc, và các thuật toán, mô hình như đã đề cập là công cụ chính để thực hiện công việc đó (bên cạnh những công cụ khác nằm ở người thực hiện như kiến thức, kỹ năng,...)
Công việc thực tế Data Analytics
1. Descriptive Analytics (phân tích mô tả): nhằm trả lời cho câu hỏi điều gì đã xảy ra, Descriptive Analytics là việc tra soát, tổng hợp, xử lý những dữ liệu hay xu hướng trong quá khứ và trình bày chúng một cách khoa học, thu hút bằng visualization (ví dụ như báo cáo tài chính, kết quả hoạt động kinh doanh,...). Những dữ liệu hay xu hướng mà Descriptive Analytics tác động có thể là những metric (chỉ số đo lường) thường gặp như KPI, ROI,... hoặc những metric được thiết kế riêng biệt cho từng lĩnh vực, industry khác nhau. Đầu ra của Descriptive Analytics chưa đi sâu vào dự đoán hay đề xuất giải pháp, kế hoạch mà chỉ dừng ở mức mô tả những dữ liệu thô một cách trực quan, dễ hiểu.
2. Diagnostic Analytics (phân tích chẩn đoán): nhằm trả lời cho câu hỏi tại sao điều gì đó lại xảy ra, Diagnostic Analytics là việc đào sâu đầu ra của Descriptive Analytics để tìm ra nguyên nhân cốt lõi hoặc key insight bên trong thông qua 3 bước chính:
- Xác định những điểm bất thường trong dữ liệu, thường là những biến động không được dự báo trước, không tuân theo những chu kỳ biết trước ở 1 chỉ số nào đó,...
- Thu thập các dữ liệu có liên quan đến dữ liệu bất thường
- Áp dụng các thuật toán, mô hình sẵn có để xác định mối liên hệ giữa những trường dữ liệu trên nhằm giải thích điểm bất thường
3. Predictive Analytics (phân tích dự đoán): nhằm trả lời cho câu hỏi điều gì sẽ xảy ra trong tương lai, Predictive Analytics là việc sử dụng các dữ liệu trong quá khứ để xác định xu hướng cũng như khả năng xu hướng đó xảy ra trong tương lai. Các công cụ phân tích dự đoán bao gồm rất nhiều kỹ thuật khác nhau như: mạng nơ-ron (neural network), cây quyết định (decision tree) hay hồi quy (regression) để đạt được đầu ra là những dự báo chính xác, sát thực về xu hướng hay khả năng xảy ra, biến đổi của các yếu tố mà dữ liệu tượng trưng trong tương lai.
4. Prescriptive Analytics (phân tích đề xuất): nhằm trả lời cho câu hỏi nên làm gì, Prescriptive Analytics sử dụng và tiếp tục phân tích các kết quả đầu ra từ Predictive Analytics nhằm đưa ra những quyết định về hành động tiếp theo như kế hoạch kinh doanh hoặc đề xuất cải tiến cho doanh nghiệp, cho phép các doanh nghiệp vẫn có thể đưa ra quyết định sáng suốt, chắc chắn và không mơ hồ, bị động.
Do mỗi giai đoạn có mục đích, vị trí, phạm vi công việc riêng, sự phức tạp trong mỗi giai đoạn cũng như trọng số đóng góp của chúng vào kết quả cuối cùng của Data Analytics cũng khác nhau và được minh họa qua hình vẽ sau:
Mặc dù mỗi giai đoạn có độ phức tạp cũng như trọng số đóng góp khác nhau, điều quan trọng khi thực hiện Data Analytics là sự phối hợp liên tục, nhịp nhàng giữa 4 giai đoạn nhỏ để quá trình Data Analytics hiệu quả và đạt được mục đích cuối cùng là đưa ra những key insight, thông tin chắt lọc có ích cho hoạt động của doanh nghiệp.
- Xác định những vấn đề doanh nghiệp đã và đang gặp phải từ dữ liệu trong quá khứ để giải quyết, khắc phục kịp thời
- Xác định những xu hướng, biến động trong có thể xảy ra trong tương lai về thị trường, khách hàng hoặc từ chính nội bộ bên trong để doanh nghiệp có thể nắm bắt và tận dụng, đem về lợi thế cạnh tranh
- Đưa ra những quyết định kinh doanh chắc chắn hơn nhằm tối ưu và tiết kiệm nguồn lực, không mạo hiểm vào những quyết định mơ hồ, không được kiểm chứng bởi những cơ sở về dữ liệu
Sự khác biệt giữa Data Analytics và Data Science
Mặc cho những thông tin về ngành Data nói chung và Data Analytics nói riêng trên thị trường ngày một nhiều, có một sự thật rằng phần lớn các bạn sinh viên, đặc biệt là sinh viên có ý định làm việc trái ngành vẫn chưa hiểu rõ và phân biệt được Data Analytics với các ngành trong cùng khối Data khác như Data Science,... dẫn đến việc định hướng và thiết kế lộ trình theo đuổi chưa phù hợp. Vậy sự khác biệt giữa Data Analytics và Data Science cụ thế như thế nào?
- Về bản chất và phạm vi công việc: Bản chất của Data Analytics như đã nói ở trên là việc phân tích và rút ra kết luận dựa trên dữ liệu thô bằng việc áp dụng các thuật toán, mô hình sẵn có. Còn bản chất của công việc Data Science là việc thiết kế cách các dữ liệu ấy được lưu trữ (database), xử lý và phân tích, trong đó bao gồm việc phát triển các thuật toán, mô hình mà Data Analyst áp dụng thông qua làm sạch dữ liệu (data wrangling), nghiên cứu các mô hình thống kê (statistical modeling) và lập trình (programming). Data Science là công việc đặt nền móng cho tất cả hoạt động liên quan đến dữ liệu của công ty, và Data Analytics là một công việc ứng dụng kết quả của nền móng ấy.
- Về độ phức tạp trong công việc: Có thể thấy, tính chất những công việc của Data Science so với Data Analytics có mức độ vĩ mô và bao quát hơn, mang tính nền tảng để tạo điều kiện cho tất cả những công việc có liên quan khác. Phạm vi của Data Science cũng sâu hơn, bao gồm việc nghiên cứu tốn nhiều thời gian, chất xám ở các lĩnh vực phức tạp như machine learning (học máy), programming (lập trình),... Còn công việc Data Analytics chủ yếu xoay quanh áp dụng các thuật toán, mô hình sẵn có một cách thường xuyên để rút ra những kết luận kịp thời cho hoạt động kinh doanh bên ngoài của doanh nghiệp.
- Về yêu cầu và lộ trình theo đuổi: Để trở thành Data Analyst hay Data Scientist, bạn không nhất thiết phải có xuất phát điểm ở 1 ngành nghề cụ thể nào, tuy nhiên có được ít nhất bằng cử nhân trong các lĩnh vực định lượng như Toán học, Thống kê hoặc Khoa học máy tính sẽ là một lợi thế lớn. Ngoài ra, một số Data Analyst hoàn toàn có thể xuất phát từ background Kinh tế với các chuyên ngành như Quản trị Kinh doanh, Kinh tế,... bởi công việc Data Analyst có bao hàm yếu tố business và không quá nặng về các nghiên cứu, phân tích định lượng phức tạp như Data Scientist. Còn Data Scientist thường có xuất phát điểm ban đầu là các ngành chuyên sâu về Công nghệ như Khoa học máy tính, Khoa học dữ liệu,....
Xu hướng phát triển và tiềm năng của Data Analytics trong tương lai
Trong bối cảnh công nghệ thông tin ngày một phát triển và bao phủ đến gần 69 triệu người dân Việt Nam sử dụng Internet, lượng dữ liệu được tạo ra và lưu trữ trong tương lai sẽ ngày một lớn dần đòi hỏi sự mở rộng và phát triển tương ứng cả về chiều rộng lẫn chiều sâu của ngành Data. Vì vậy, tiềm năng phát triển của ngành Data trong tương lai là vô cùng lớn, nhờ đó mà cơ hội việc làm và phát triển sự nghiệp của những người theo đuổi ngành Data Analytics cũng rộng mở.
Mặc dù hiện nay các ứng dụng công nghệ như hệ thống phân tích dữ liệu tự động đang được đưa vào sử dụng trong nhiều công ty để phục vụ các công việc Data, nó vẫn chưa thể đáp ứng hoàn toàn nhu cầu của công ty, doanh nghiệp. Theo các nghiên cứu, 80% lượng công việc không thể tự động hóa thông thường; 20% còn lại có thể thực hiện tự động bằng công nghệ nhưng hiệu quả chưa cao. Hơn nữa, việc ứng dụng các mô hình công nghệ chỉ có thể giải quyết được những vấn đề đơn giản, còn các vấn đề phức tạp hơn vẫn cần đến tư duy của con người mới có thể giải quyết được. Do đó, ngành Data Analytics vẫn sẽ không biến mất ngay cả khi công nghệ phát triển.
Cơ hội việc làm trong ngành
Theo báo cáo của Navigos Group về Thị trường nhân lực ngành Công nghệ thông tin, đi cùng với sự phát triển và mở rộng nhanh chóng về quy mô của ngành là nhu cầu tuyển dụng cũng ngày một lớn theo, tăng gấp 4 lần sau một thập kỷ từ năm 2010 đến đầu năm 2020. Đối với ngành Data nói riêng, đây là một ngành nghề mới phát triển và trỗi dậy trong những năm gần đây ở Việt Nam, tuy nhiên nguồn nhân lực Công nghệ thông tin trong nước chưa phản ứng kịp thời với nhu cầu của ngành Data dẫn đến tình trạng khan hiếm nhân lực trầm trọng. Sự chênh lệch giữa cung và cầu về nhân lực trong ngành luôn ở mức cao khiến hầu hết các công ty, doanh nghiệp gặp khó khăn trong việc tuyển dụng các vị trí liên quan đến ngành Data như Data Scientist, Data Analyst... Mức lương trung bình của ngành Data cũng ở mức cao hơn so với mặt bằng thông thường, dao động ở mức 1280$. Điều này cho thấy cơ hội nghề nghiệp trong ngành Data nói chung và Data Analytics nói riêng đang thực sự rộng mở và đầy hứa hẹn.
Vai trò, tầm quan trọng của Data Analytics
Vai trò của Data Analytics chủ yếu nằm ở việc giúp các công ty, doanh nghiệp nâng cao hoạt động kinh doanh của mình thông qua việc:- Xác định những vấn đề doanh nghiệp đã và đang gặp phải từ dữ liệu trong quá khứ để giải quyết, khắc phục kịp thời
- Xác định những xu hướng, biến động trong có thể xảy ra trong tương lai về thị trường, khách hàng hoặc từ chính nội bộ bên trong để doanh nghiệp có thể nắm bắt và tận dụng, đem về lợi thế cạnh tranh
- Đưa ra những quyết định kinh doanh chắc chắn hơn nhằm tối ưu và tiết kiệm nguồn lực, không mạo hiểm vào những quyết định mơ hồ, không được kiểm chứng bởi những cơ sở về dữ liệu
Sự khác biệt giữa Data Analytics và Data Science
Mặc cho những thông tin về ngành Data nói chung và Data Analytics nói riêng trên thị trường ngày một nhiều, có một sự thật rằng phần lớn các bạn sinh viên, đặc biệt là sinh viên có ý định làm việc trái ngành vẫn chưa hiểu rõ và phân biệt được Data Analytics với các ngành trong cùng khối Data khác như Data Science,... dẫn đến việc định hướng và thiết kế lộ trình theo đuổi chưa phù hợp. Vậy sự khác biệt giữa Data Analytics và Data Science cụ thế như thế nào?
- Về bản chất và phạm vi công việc: Bản chất của Data Analytics như đã nói ở trên là việc phân tích và rút ra kết luận dựa trên dữ liệu thô bằng việc áp dụng các thuật toán, mô hình sẵn có. Còn bản chất của công việc Data Science là việc thiết kế cách các dữ liệu ấy được lưu trữ (database), xử lý và phân tích, trong đó bao gồm việc phát triển các thuật toán, mô hình mà Data Analyst áp dụng thông qua làm sạch dữ liệu (data wrangling), nghiên cứu các mô hình thống kê (statistical modeling) và lập trình (programming). Data Science là công việc đặt nền móng cho tất cả hoạt động liên quan đến dữ liệu của công ty, và Data Analytics là một công việc ứng dụng kết quả của nền móng ấy.
- Về độ phức tạp trong công việc: Có thể thấy, tính chất những công việc của Data Science so với Data Analytics có mức độ vĩ mô và bao quát hơn, mang tính nền tảng để tạo điều kiện cho tất cả những công việc có liên quan khác. Phạm vi của Data Science cũng sâu hơn, bao gồm việc nghiên cứu tốn nhiều thời gian, chất xám ở các lĩnh vực phức tạp như machine learning (học máy), programming (lập trình),... Còn công việc Data Analytics chủ yếu xoay quanh áp dụng các thuật toán, mô hình sẵn có một cách thường xuyên để rút ra những kết luận kịp thời cho hoạt động kinh doanh bên ngoài của doanh nghiệp.
- Về yêu cầu và lộ trình theo đuổi: Để trở thành Data Analyst hay Data Scientist, bạn không nhất thiết phải có xuất phát điểm ở 1 ngành nghề cụ thể nào, tuy nhiên có được ít nhất bằng cử nhân trong các lĩnh vực định lượng như Toán học, Thống kê hoặc Khoa học máy tính sẽ là một lợi thế lớn. Ngoài ra, một số Data Analyst hoàn toàn có thể xuất phát từ background Kinh tế với các chuyên ngành như Quản trị Kinh doanh, Kinh tế,... bởi công việc Data Analyst có bao hàm yếu tố business và không quá nặng về các nghiên cứu, phân tích định lượng phức tạp như Data Scientist. Còn Data Scientist thường có xuất phát điểm ban đầu là các ngành chuyên sâu về Công nghệ như Khoa học máy tính, Khoa học dữ liệu,....
Xu hướng phát triển và tiềm năng của Data Analytics trong tương lai
Trong bối cảnh công nghệ thông tin ngày một phát triển và bao phủ đến gần 69 triệu người dân Việt Nam sử dụng Internet, lượng dữ liệu được tạo ra và lưu trữ trong tương lai sẽ ngày một lớn dần đòi hỏi sự mở rộng và phát triển tương ứng cả về chiều rộng lẫn chiều sâu của ngành Data. Vì vậy, tiềm năng phát triển của ngành Data trong tương lai là vô cùng lớn, nhờ đó mà cơ hội việc làm và phát triển sự nghiệp của những người theo đuổi ngành Data Analytics cũng rộng mở.
Mặc dù hiện nay các ứng dụng công nghệ như hệ thống phân tích dữ liệu tự động đang được đưa vào sử dụng trong nhiều công ty để phục vụ các công việc Data, nó vẫn chưa thể đáp ứng hoàn toàn nhu cầu của công ty, doanh nghiệp. Theo các nghiên cứu, 80% lượng công việc không thể tự động hóa thông thường; 20% còn lại có thể thực hiện tự động bằng công nghệ nhưng hiệu quả chưa cao. Hơn nữa, việc ứng dụng các mô hình công nghệ chỉ có thể giải quyết được những vấn đề đơn giản, còn các vấn đề phức tạp hơn vẫn cần đến tư duy của con người mới có thể giải quyết được. Do đó, ngành Data Analytics vẫn sẽ không biến mất ngay cả khi công nghệ phát triển.
Cơ hội việc làm trong ngành
Theo báo cáo của Navigos Group về Thị trường nhân lực ngành Công nghệ thông tin, đi cùng với sự phát triển và mở rộng nhanh chóng về quy mô của ngành là nhu cầu tuyển dụng cũng ngày một lớn theo, tăng gấp 4 lần sau một thập kỷ từ năm 2010 đến đầu năm 2020. Đối với ngành Data nói riêng, đây là một ngành nghề mới phát triển và trỗi dậy trong những năm gần đây ở Việt Nam, tuy nhiên nguồn nhân lực Công nghệ thông tin trong nước chưa phản ứng kịp thời với nhu cầu của ngành Data dẫn đến tình trạng khan hiếm nhân lực trầm trọng. Sự chênh lệch giữa cung và cầu về nhân lực trong ngành luôn ở mức cao khiến hầu hết các công ty, doanh nghiệp gặp khó khăn trong việc tuyển dụng các vị trí liên quan đến ngành Data như Data Scientist, Data Analyst... Mức lương trung bình của ngành Data cũng ở mức cao hơn so với mặt bằng thông thường, dao động ở mức 1280$. Điều này cho thấy cơ hội nghề nghiệp trong ngành Data nói chung và Data Analytics nói riêng đang thực sự rộng mở và đầy hứa hẹn.
Sinh viên Kinh tế cần biết gì khi lựa chọn Data Analytics?
Với tất cả những cơ hội mà ngành Data Analytics đang rộng mở chào đón, sinh viên Kinh tế cần biết những gì ngay từ đầu để chuẩn bị bản thân và định hướng đúng đắn trên con đường đến với ngành?
Rào cản ban đầu
- Tư duy, định hướng: Hầu hết các bạn sinh viên khi bắt đầu công việc trái ngành đều mang tâm lý tự ti và lo sợ vì không biết bắt đầu như thế nào, định hướng ra sao cho đúng. Một cách tự nhiên, các bạn thường cố gắng học thật nhiều, lấp đầy lỗ hổng về kiến thức, kỹ năng của lĩnh vực đang theo đuổi càng nhiều càng tốt để rút ngắn khoảng cách so với những bạn theo đuổi từ đầu. Tương tự với Data Analytics, sinh viên Kinh tế thường chỉ tập trung vào trau dồi và thành thạo các công cụ làm việc như SQL, ngôn ngữ lập trình,... mà không tập trung vào thay đổi tư duy của mình cho phù hợp, chưa hiểu rõ về bản chất cũng như yêu cầu thực sự của công việc. Ở giai đoạn đầu, điều này có thể không gây khó khăn nhiều cho sinh viên Kinh tế bởi việc học các công cụ, ngôn ngữ lập trình thường ít khó khăn hơn và dễ định hướng rõ ràng, tuy nhiên về lâu dài, sự định hướng tư duy không phù hợp sẽ trở thành rào cản cho các bạn phát triển và tiến xa hơn với nghề khi không thể giải quyết các vấn đề khó khăn và phức tạp hơn, nằm ngoài phạm vi ảnh hưởng của các công cụ thông thường.
- Kiến thức: Cũng như những ngành nghề thuộc khối Công nghệ thông tin khác, những kiến thức của ngành Data Analytics sẽ tập trung chủ yếu ở các môn học định lượng như Toán học, Xác suất thống kê… phần nào gây khó khăn cho sinh viên Kinh tế - vốn đã quen với các môn học Khoa học xã hội, Kinh tế học thiên về định tính khi mới theo đuổi. Ngoài ra, do mới bước đầu làm quen với nghề, sinh viên Kinh tế cũng chưa kịp hình thành và phát triển technology sense nhanh nhạy, do đó gặp khó khăn trong việc tiếp thu và thực hành các công cụ có liên quan như ngôn ngữ lập trình (Python, R) hay SQL...
- Kỹ năng: Các kỹ năng của ngành Data Analytics chủ yếu xoay quanh kỹ năng làm việc với dữ liệu như Data Mining, Data Warehousing…. và yêu cầu thành thạo các công cụ làm việc (SQL, Tableau). Hầu hết các kỹ năng trên đều cần một thời gian dài để hình thành, trau dồi đến mức độ thành thạo đủ để hoàn thành tốt công việc của Data Analytics, do đó có thể trở thành rào cản cho sinh viên Kinh tế khi mới bước chân vào nghề.
Với những rào cản khó khăn ban đầu như vậy, sinh viên Kinh tế nên làm thế nào để tìm được lối đi đúng đắn, phù hợp trên con đường theo đuổi Data Analytics?
Lối vào ngành cho sinh viên Kinh tế
- Thay đổi tư duy phù hợp ngay từ đầu: Điều quan trọng trước khi học kiến thức mới hay quyết định bước vào bất cứ ngành nghề nào đó là học cách suy nghĩ, tư duy của những người trong nghề. Đối với Data Analytics nói riêng và các ngành nghề thuộc khối ngành CNTT nói chung, cách suy nghĩ ấy xoay quanh việc đặt mình vào máy tính và suy nghĩ theo những gì máy tính có thể suy nghĩ, cụ thể là computational thinking (tư duy máy tính) và computer logic (logic máy tính). Sau khi đã hình thành và xác định được tư duy phù hợp, tất cả việc trau dồi kiến thức, kỹ năng sau này có liên quan sẽ trở nên có định hướng và dễ dàng hơn, bởi tất cả đều xuất phát từ việc thấu hiểu bản chất thật sự của những kiến thức, kỹ năng đó. Bạn có thể tham khảo cuốn sách: “How to think like a Computer Scientist” để có thể hiểu hơn về cách tư duy nói trên và định hướng cho bản thân một cách phù hợp.
- Kiến thức, kỹ năng: Việc trau dồi kiến thức và kỹ năng của ngành Data Analytics nên xuất phát sau khi đã hình thành và phát triển tư duy phù hợp. Về kiến thức, nền tảng của Data Analytics hay hầu hết các ngành thuộc khối Công nghệ đều xoay quanh các môn học định lượng. Ban đầu, sinh viên Kinh tế hoàn toàn có thể trau dồi kiến thức định lượng thông qua các môn học trên trường như Toán (Toán cao cấp), Xác suất thống kê,... và có thể tự tìm hiểu chuyên sâu hơn sau khi đã có nền tảng vững chắc. Về kỹ năng, sinh viên Kinh tế có thể bắt đầu với việc học và thành thạo các công cụ như ngôn ngữ lập trình (Python, R), SQL,... và phát triển các kỹ năng khó hơn như kỹ năng làm việc với dữ liệu trong quá trình thực hành, làm việc thực tế sau này.
Chuẩn bị như thế nào để sẵn sàng bước vào ngành?
Tự chuẩn bị: Các bạn sinh viên Kinh tế có thể tham khảo những cách tiếp cận về tư duy, kiến thức và kỹ năng đề xuất ở trên để có thể trang bị cho mình những hành trang cơ bản nhất để bước vào ngành. Tuy nhiên nếu muốn tiến xa hơn, các bạn buộc phải bỏ nhiều công sức, nỗ lực hơn so với những bạn sinh viên đã định hướng theo đuổi từ đầu, hoặc lựa chọn trau dồi thêm ở những khóa học, môi trường bên ngoài.Khóa học, môi trường bên ngoài: Các bạn có thể tham khảo các khóa học chất lượng về Data Analytics của Palos Institute hoặc Nordic Coder… Ngoài ra, còn 1 cách tiếp cận khác cấp tốc và chi phí cao hơn nhiều đó là các khóa học Coding Bootcamp, tuy nhiên các khóa học này chưa thịnh hành ở Việt Nam mà mới xuất hiện ở các nước như Mỹ.
0 comments: