Trả lời câu hỏi Data Model là gì? Tìm hiểu Data Model và Data Modeling
Theo dõi viecday365 tạiNếu bạn thường xuyên làm việc với các loại dữ liệu trong doanh nghiệp thì chắc hẳn bạn đã từng tiếp xúc với thuật ngữ Data model – hay Mô hình dữ liệu. Nhưng nếu bạn mới bước chân vào lĩnh vực này thì có lẽ bạn chưa hình dung được tính phức tạp của các mô hình dữ liệu. Trong bài viết ngày hôm nay chúng ta sẽ cùng nhau đi tìm hiểu Data Model là gì và quá trình Data Modeling.
1. Những thông tin bạn cần biết về Data Model
1.1. Data Model là gì?
Data Model là một thuật ngữ chuyên ngành trong lĩnh vực Công nghệ thông tin. Data Model dịch sang tiếng Việt được hiểu là Mô hình dữ liệu.
Mô hình dữ liệu đề cập đến các mối quan hệ liên hợp logic và luồng dữ liệu giữa các phần tử dữ liệu khác nhau tham gia vào một môi trường thông tin chung. Mô hình dữ liệu cũng ghi lại cách dữ liệu được lưu trữ và truy xuất.
Mô hình dữ liệu tạo điều kiện thuận lợi cho việc kinh doanh và phát triển các kỹ thuật truyền thông bằng cách thể hiện chính xác các yêu cầu của hệ thống thông tin thông qua cách thiết lập các phản ứng cần thiết cho các yêu cầu đó. Mô hình dữ liệu giúp thể hiện dữ liệu nào được yêu cầu và định dạng nào sẽ được sử dụng cho các quy trình kinh doanh khác nhau.
Một mô hình dữ liệu có thể cụ thể hoặc rất trừu tượng. Các thành phần chính của mô hình dữ liệu bao gồm:
+ Loại dữ liệu (Data types)
+ Các mục dữ liệu (Data items)
+ Nguồn dữ liệu (Data sources)
+ Nguồn sự kiện (Event sources) (Là tên gọi để chỉ một bảng DBMS chứa các dữ liệu sự kiện trong quá trình sử dụng các lệnh phân đoạn động)
+ Liên kết (Links)
Xem thêm: Data center là gì? Tìm hiểu khái niệm, chức năng của data center
1.2. Các kiểu mô hình dữ liệu
Mô hình dữ liệu được biểu diễn bằng các ký hiệu mô hình dữ liệu và thường được trình bày dưới dạng đồ họa. Mục đích chính của mô hình dữ liệu là hỗ trợ các hệ thống thông tin bằng cách hiển thị định dạng và định nghĩa của các dữ liệu khác nhau có liên quan. Mô hình dữ liệu cũng giúp ngăn chặn tình trạng dư thừa dữ liệu. Thông tin được lưu trữ trong các mô hình dữ liệu có ý nghĩa lớn đối với các doanh nghiệp vì nó quy định mối quan hệ giữa các bảng cơ sở dữ liệu, khóa ngoại và các sự kiện liên quan.
Ba kiểu cơ bản của mô hình dữ liệu bao gồm:
+ Mô hình dữ liệu khái niệm (Conceptual data models)
+ Mô hình dữ liệu vật lý (Physical data models)
+ Mô hình dữ liệu logic (Logical data models)
1.2.1. Mô hình dữ liệu khái niệm (Conceptual data models)
Mô hình dữ liệu khái niệm, hay còn được gọi là Domain Model, giúp hiểu toàn diện về nội dung mà hệ thống sẽ lưu trữ, cách tổ chức hệ thống và những quy tắc kinh doanh kết nối.
Các mô hình dữ liệu khái niệm thường được tạo ra trong quá trình thu thập các yêu cầu ban đầu của dự án. Thông thường, mô hình dữ liệu khái niệm bao gồm các lớp thực thể (xác định những điều quan trọng đối với doanh nghiệp), các đặc tính và ràng buộc của chúng, mối quan hệ giữa các mô hình dữ liệu và các yêu cầu liên quan đến bảo mật và tính toàn vẹn của dữ liệu.
1.2.2. Mô hình dữ liệu logic (Logical data models)
Mô hình dữ liệu logic ít trừu tượng hơn và cung cấp chi tiết hơn về các khái niệm và mối quan hệ trong các miền (domain) đang được xem xét.
Mô hình dữ liệu logic chỉ ra các thuộc tính dữ liệu (chẳng hạn như kiểu dữ liệu và độ dài tương ứng của chúng) và hiển thị mối quan hệ giữa các thực thể (Entity). Mô hình dữ liệu logic không chỉ định bất kỳ yêu cầu hệ thống kỹ thuật nào.
Các mô hình dữ liệu logic có thể hữu ích trong các môi trường triển khai mang tính thủ tục cao hoặc cho các dự án thiên về dữ liệu, chẳng hạn như thiết kế kho dữ liệu…
1.2.3. Mô hình dữ liệu vật lý (Physical data models)
Mô hình dữ liệu vật lý cung cấp một lược đồ về cách dữ liệu sẽ được lưu trữ trong cơ sở dữ liệu. Có thể nói đây là thứ ít trừu tượng nhất trong số các mô hình dữ liệu.
Mô hình dữ liệu vật lý đưa ra một thiết kế hoàn thiện có thể được triển khai dưới dạng cơ sở dữ liệu quan hệ, bao gồm các bảng kết hợp sử dụng để minh họa mối quan hệ giữa các thực thể, cũng như khóa chính và khóa ngoại sẽ được sử dụng để duy trì các mối quan hệ đó. Mô hình dữ liệu vật lý có thể bao gồm các thuộc tính cụ thể của hệ thống quản lý cơ sở dữ liệu (DBMS), trong dó bao gồm cả việc điều chỉnh hiệu suất.
2. Mô hình hóa dữ liệu (Data Modeling)
2.1. Mô hình hóa dữ liệu là gì?
Mô hình hóa dữ liệu là sự trình bày cấu trúc dữ liệu trong bảng cho cơ sở dữ liệu của một công ty. Mô hình dữ liệu được các nhà phân tích chức năng và kỹ thuật sử dụng trong việc thiết kế và triển khai cơ sở dữ liệu.
Mô hình dữ liệu được sử dụng cho nhiều mục đích, từ mô hình khái niệm cấp cao (High-level conceptual models ) cho đến mô hình dữ liệu vật lý (Physical data models).
Mô hình dữ liệu được xây dựng xung quanh nhu cầu kinh doanh. Các quy tắc và yêu cầu được xác định trước thông qua phản hồi từ các bên liên quan trong kinh doanh để chúng có thể được đưa vào thiết kế của một hệ thống mới hoặc được điều chỉnh trong quá trình lặp lại hệ thống hiện có.
Dữ liệu có thể được mô hình hóa ở nhiều mức độ trừu tượng khác nhau. Quá trình bắt đầu bằng cách thu thập thông tin về các yêu cầu kinh doanh từ các bên liên quan và người dùng cuối. Các quy tắc nghiệp vụ này sau đó được chuyển thành cấu trúc dữ liệu để hình thành một thiết kế cơ sở dữ liệu cụ thể. Mô hình dữ liệu có thể được so sánh với lộ trình, bản thiết kế của kiến trúc sư hoặc bất kỳ sơ đồ chính thức nào giúp hiểu sâu hơn về những gì đang được thiết kế.
Mô hình hóa dữ liệu sử dụng các lược đồ chuẩn hóa và các kỹ thuật trong khoa học dữ liệu.
Trong điều kiện lý tưởng nhất, các mô hình dữ liệu là các tài liệu sống phát triển cùng với sự thay đổi của các nhu cầu kinh doanh. Mô hình dữ liệu đóng vai trò quan trọng trong việc hỗ trợ các quy trình kinh doanh và hoạch định kiến trúc cũng như chiến lược CNTT của doanh nghiệp.
Mô hình dữ liệu có thể được chia sẻ với các nhà cung cấp, đối tác hoặc các đồng nghiệp trong ngành nếu cần.
Xem thêm: Data Processing là gì? Vai trò của Data Processing với DN hiện nay
2.2. Các loại mô hình hóa dữ liệu
Mô hình hóa dữ liệu đã phát triển cùng với các hệ thống quản lý cơ sở dữ liệu, với các loại mô hình ngày càng phức tạp khi nhu cầu lưu trữ dữ liệu của các doanh nghiệp ngày càng tăng.
Sau đây là một số loại mô hình hóa dữ liệu thường thấy.
2.2.1. Mô hình dữ liệu phân cấp (Hierarchical data models)
Đây là mô hình đại diện cho các mối quan hệ “one-to-many” trong một định dạng giống như hình một cái cây. Trong kiểu mô hình này, mỗi bản ghi có một gốc duy nhất và ánh xạ tới một hoặc nhiều bảng con.
Mô hình này được triển khai trong Hệ thống Quản lý Thông tin IBM (IMS), được giới thiệu vào năm 1966 và nhanh chóng được sử dụng rộng rãi, đặc biệt là trong lĩnh vực Ngân hàng. Mặc dù cách tiếp cận này kém hiệu quả hơn so với các mô hình cơ sở dữ liệu được phát triển gần đây, nhưng nó vẫn được sử dụng trong các hệ thống Ngôn ngữ đánh dấu mở rộng (XML) và hệ thống thông tin địa lý (GIS).
2.2.2. Mô hình dữ liệu quan hệ (Relational data models)
Mô hình này ban đầu được nhà nghiên cứu E.F. Codd của IBM đề xuất vào năm 1970. Ngày nay chúng vẫn được triển khai trong nhiều cơ sở dữ liệu quan hệ khác nhau và chủ yếu là được sử dụng trong điện toán doanh nghiệp.
Mô hình dữ liệu quan hệ không yêu cầu hiểu biết chi tiết về các thuộc tính vật lý của bộ lưu trữ dữ liệu đang được sử dụng. Trong đó, các phân đoạn dữ liệu được nối một cách rõ ràng thông qua việc sử dụng các bảng, làm giảm độ phức tạp của cơ sở dữ liệu.
Mô hình dữ liệu quan hệ được sử dụng làm nền tảng xây dựng Cơ sở dữ liệu quan hệ. Cơ sở dữ liệu quan hệ hoạt động để duy trì tính toàn vẹn của dữ liệu và giảm thiểu sự dư thừa. Chúng thường được sử dụng trong hệ thống điểm bán hàng, cũng như khi xử lý các giao dịch khác.
2.2.3. Mô hình dữ liệu mối quan hệ thực thể (ER)
Mô hình này sử dụng các sơ đồ để biểu diễn mối quan hệ giữa các thực thể trong cơ sở dữ liệu. Một số công cụ mô hình hóa ER được các kiến trúc sư dữ liệu sử dụng để tạo bản đồ trực quan truyền tải các mục tiêu thiết kế cơ sở dữ liệu.
2.2.4. Mô hình dữ liệu định hướng đối tượng (Object-oriented data models)
Mô hình này phổ biến vào giữa những năm 1990. Các “đối tượng” được nhóm theo phân cấp lớp và có các tính năng liên quan.
Cơ sở dữ liệu định hướng đối tượng (Object-oriented database) có thể kết hợp các bảng và cũng có thể hỗ trợ các mối quan hệ dữ liệu phức tạp hơn. Cách tiếp cận này được sử dụng trong cơ sở dữ liệu đa phương tiện và siêu văn bản cũng như các trường hợp khác.
2.2.5. Mô hình chiều dữ liệu (Dimensional data models)
Mô hình này được phát triển bởi Ralph Kimball và được thiết kế để tối ưu hóa tốc độ truy xuất dữ liệu cho các mục đích phân tích trong kho dữ liệu.
Trong khi các mô hình quan hệ và ER nhấn mạnh đến khả năng lưu trữ hiệu quả, các mô hình chiều dữ liệu tăng khả năng dự phòng để giúp định vị thông tin nhằm mục đích báo cáo và truy xuất dễ dàng hơn. Mô hình này thường được sử dụng nhiều trên các hệ thống OLAP.
Hy vọng qua bài viết trên đây của viecday365 bạn đã hiểu được Mô hình dữ liệu – Data Model là gì và nắm những thông tin cần biết về các loại mô hình dữ liệu. Bên cạnh đó bài viết cũng cung cấp thêm thông tin về các loại mô hình hóa dữ liệu, là một phần gắn liền với mô hình dữ liệu.
3825 0