پایگاه داده‌ها (به طور خلاصه پایگاه)، بانک اطلاعاتی، دادِگان و یا دیتابیس (Database) به مجموعه‌ای از داده‌ها با ساختار منظم و سامانمند گفته می‌شود.

پایگاه داده‌ها (دادگان یا بانک اطّلاعاتی) به مجموعه‌ای از اطّلاعات با ساختار منظم و سامانمند گفته می‌شود. پایگاه‌های داده‌ها معمولاً در قالبی که برای دستگاه‌ها و رایانه‌ها قابل خواندن و دسترسی باشد ذخیره می‌شوند. البته چنین شیوه ذخیره‌سازی اطلاعات تنها روش موجود نیست و شیوه‌های دیگری مانند ذخیره‌سازی ساده در پرونده‌ها نیز استفاده می‌گردد. آنچه ذخیره‌سازی داده‌ها در پایگاه‌های داده‌ها را مؤثر می‌سازد وجود یک ساختار مفهومی برای ذخیره‌سازی و روابط بین داده‌ها است.

پایگاه داده در اصل مجموعه‌ای سازمان یافته از اطلاعات است.این واژه از دانش رایانه سرچشمه می‌گیرد، اما کاربرد وسیع و عمومی نیز دارد، این وسعت به اندازه‌ای است که مرکز اروپایی پایگاه داده (که تعاریف خردمندانه‌ای برای پایگاه داده ایجاد می‌کند) شامل تعاریف غیر الکترونیکی برای پایگاه داده می‌باشد. در این نوشتار به کاربردهای تکنیکی برای این اصطلاح محدود می‌شود.
یک تعریف ممکن این است که: پایگاه داده مجموعه‌ای از رکوردهای ذخیره شده در رایانه با یک روش سیستماتیک (اصولی) مثل یک برنامه رایانه‌ای است که می‌تواند به سؤالات کاربر پاسخ دهد. برای ذخیره و بازیابی بهتر، هر رکورد معمولاً به صورت مجموعه‌ای از اجزای داده‌ای یا رویدادها سازماندهی می‌گردد. بخش‌های بازیابی شده در هر پرسش به اطلاعاتی تبدیل می‌شود که برای اتخاذ یک تصمیم کاربرد دارد. برنامه رایانه‌ای که برای مدیریت و پرسش و پاسخ بین پایگاه‌های داده‌ای استفاده می‌شود را مدیر سیستم پایگاه داده‌ای یا به‌اختصار (DBMS) می‌نامیم. خصوصیات و طراحی سیستم‌های پایگاه داده‌ای در علم اطلاعات مطالعه می‌شود.

مفهوم اصلی پایگاه داده این است که پایگاه داده مجموعه‌ای از رکوردها یا تکه‌هایی از یک شناخت است.نوعاً در یک پایگاه داده توصیف ساخت یافته‌ای برای موجودیت‌های نگه داری شده در پایگاه داده وجود دارد: این توصیف با یک الگو یا مدل شناخته می‌شود. مدل توصیفی، اشیا پایگاه‌های داده و ارتباط بین آنها را نشان می‌دهد. روش‌های متفاوتی برای سازماندهی این مدل‌ها وجود دارد که به آنها مدل‌های پایگاه داده گوییم. پرکاربردترین مدلی که امروزه بسیار استفاده می‌شود، مدل رابطه‌ای است که به طور عام به صورت زیر تعریف می‌شود: نمایش تمام اطلاعاتی که به فرم جداول مرتبط که هریک از سطرها و ستونها تشکیل شده است(تعریف حقیقی آن در علم ریاضیات برسی می‌شود). در این مدل وابستگی‌ها به کمک مقادیر مشترک در بیش از یک جدول نشان داده می‌شود. مدل‌های دیگری مثل مدل سلسله مراتب و مدل شبکه‌ای به طور صریح تری ارتباط‌ها را نشان می‌دهند.

در مباحث تخصصی‌تر اصطلاح پایگاه داده به صورت مجموعه‌ای از رکوردهای مرتبط با هم تعریف می‌شود. بسیاری از حرفه‌ای‌ها مجموعه‌ای از داده‌هایی با خصوصیات یکسان به منظور ایجاد یک پایگاه داده‌ای یکتا استفاده می‌کنند.

معمولاً DBMS ها بر اساس مدل‌هایی که استفاده می‌کنند تقسیم بندی می‌شوند: ارتباطی، شیء گرا، شبکه‌ای و امثال آن. مدل‌های داده‌ای به تعیین زبانهای دسترسی به پایگاه‌های داده علاقه‌مند هستند. بخش قابل توجهی از مهندسی DBMS مستقل از مدل‌های می‌باشد و به فاکتورهایی همچون اجرا، هم‌زمانی، جامعیت و بازیافت از خطاهای سخت‌افزاری وابسته‌است.در این سطح تفاوت‌های بسیاری بین محصولات وجود دارد.