وبلاگ تخصصی جامعه برنامه‌نویسی مدرن آی او استریم

آخرین پست‌های مرتبط با فناوری و برنامه نویسی مدرن در این بخش در اختیار شما قرار می‌گیرد.



 ۵۱ اصطلاحی که شما باید در زمینه ی پایگاه داده (Database) آن‌ها را بدانید


نویسنده: الهه انصاری
تاریخ انتشار : 1396/11/17 12:20 /   /  موضوعات : فناوری دفعات بازدید : 253  

موضوع صحبت عمده مردم مبني بر اين است كه سرعت توسعه حجم داده ها به زودي به ميزان خارج از توان كنترل خواهد رسید. با وجود اینکه تعداد نه چندان زیادی درمورد جنبه ی پایگاه داده ای این موضوع صحبت می کنند، اما باید به این قضیه نیز پرداخت! با افزایش روزافزون داده ها، پایگاه داده ها نیز باید قادر به پاسخگویی به این تغییر باشند. به همین دلیل نه تنها نحوه ی آنالیز مقدار رو به رشد داده ها اهمیت زیادی دارد، بلکه چگونگی داشتن پایگاه داده ای که بتواند این داده ها را مدیریت کند نیز از اهمیت بسزایی برخوردار است. اگر قصد دارید که در این سیل عظیم از داده ها شناور باشید، در ادامه لیستی از مهم ترین اصطلاحات پایگاه داده ای را برای شما می آوریم. 

A
  • خاصیت ACID (Atomicity, Consistency, Isolation, Durability): اصطلاحی است که به ویژگی های مدل تراکنش های پایگاه داده اشاره دارد و به طور سنتی برای پایگاه داده های SQL استفاده می شود. ( اگر تراکنشی در پایگاه از خاصیت ACID پشتیبانی کند، منجر به دقت و جامعیت در پایگاه داده می شود.)
  • تجمیع (Aggregate): خوشه ای از اشیاء که می توان با آن ها مانند یک تک واحد رفتار کرد؛ واحدی ایده آل برای ذخیره سازی داده ها بر روی سیستم های توزیع شده ی عظیم.
  • آپاچی کاساندرا (Apache Cassandra): پایگاه داده ی متن بازِ توزیع شده که قادر به ذخیره و مدیریت کلان داده در سراسر سرور ها است و می تواند پایگاه داده ای با قدرت خواندن متمرکز برای سیستم های بزرگ هوش تجاری (BI) باشد.
  • آپاچی لوسن (Apache Lucene): یک کتابخانه ی متن بازِ بازیابی متن، که عموما برای جستجوی متن کامل، پیاده سازی موتور های جستجو و پیاده سازی سیستم های پیشنهاد دهنده استفاده می شود.
  • آپاچی اسپارک (Apache Spark): یک چارچوب متن بازِ پردازش موازی که با برنامه های بزرگ تجزیه و تحلیل داده ها، تجزیه و تحلیل در زمان واقعی (real-time) و پردازش داده ی حجم کارها (workloads) سر و کار دارد.
B
  • خاصیت BASE (Basic Availability, Soft State, Eventual Consistency): اصطلاحی است که به ویژگی های مدل تراکنش های پایگاه داده اشاره دارد؛ بخصوص در پایگاه داده های غیر رابطه ای (NoSQL) که نیاز به مدیریت داده های بدون ساختار دارند.
  • B-Tree: ساختمان داده ای است که در آن تمامی گره های پایانی در یک فاصله ی یکسان از ریشه قرار دارند و تمامی گره های غیر پایانی ما بین n تا 2n زیردرخت یا اشاره گر ها هستند. این ساختار برای سیستم هایی که عمل خواندن و نوشتن را روی بلوک های بزرگی از داده انجام می دهند و یا بیشتر به عمل خواندن می پردازند، بهینه هستند.
C
  • پایگاه داده ی ابری بومی (Cloud-native database): پایگاه داده ای که بر مبانی رایانش ابری ساخته و اجرا می شود.
  • پردازش رویداد پیچیده (Complex event processing): روندی سازمانی برای جمع آوری داده از جریان های مختلف با هدف تحلیل و برنامه ریزی است.
  • سازگاری (Consistency): سازگاری، یکی از چهار ویژگی تراکنش پایگاه داده، بدین معناست که اگر تراکنشی ناموفق شود، داده به حالت اصلی خود باز می گردد. اما در صورتی که تراکنش موفقیت آمیز باشد، حالت جدیدی از داده بوجود خواهد آمد. 
D
  • خوشه بندی پایگاه داده (Database clustering): اتصال دو یا چند سرور و نمونه (instance) به پایگاه داده که عموما برای مزیت هایی چون تحمل خطا، تعادل بار (load balancing) و پردازش موازی بکار می رود.
  • سوابق داده یا اصل و نسب داده (Data lineage): شامل اطلاعاتی است در مورد اینکه داده از کجا آمده است، چگونه تغییر می کند و به کجا راه پیدا خواهد کرد. سوابق داده می تواند برای اعتبارسنجی آدرس (Address validation) و اشکال زدایی (debugging) استفاده شود.
  • مدیریت اطلاعات (Data management): یک چرخه ی حیات کامل از اینکه یک سازمان چگونه به ذخیره سازی، پردازش و تجزیه و تحلیل مجموعه داده ها می پردازد.
  • داده کاوی (Data mining): فرآیند کشف الگوها در مجموعه های بزرگ داده و تبدیل آن اطلاعات به قالب قابل فهم را داده کاوی گویند.
  • سیستم مدیریت پایگاه داده (Database management system, DBMS): مجموعه ای از نرم افزار و ابزار ها هستند که مدیریت داده بین کاربر نهایی و پایگاه داده را بر عهده دارند.
  • انبار داده (Data warehouse): یک بانک اطلاعاتی بزرگ می‌باشد که از طریق آن کلیه ی داده های حال و گذشته ی یک سازمان جهت انجام عملیات گزارش گیری و آنالیز، در دسترس مدیران قرار می‌گیرد. انبار داده نقش مهمی در تصمیم گیری مدیران کمپانی برای تعیین یک استراتژی موفق دارد.
  • پایگاه داده ی رابطه ای توزیع شده (Distributed relational database): پایگاه داده ای که شامل اشیاء مانند جداول است که بخشی از سیستم های مختلفِ در عین حال متصل هستند.
  • سیستم های توزیع شده (Distributed systems): مجموعه ای از کامپیوترهای شخصی که با هم کار می کنند و به نظر می رسد به عنوان یک سیستم واحد عمل می کنند. این کار نیاز به دسترسی به یک پایگاه داده ی مرکزی، چندین نسخه از پایگاه داده در هر کامپیوتر و یا پارتیشن های پایگاه داده در هر دستگاه دارد.
  • مخازن سند (Document store): نوعی از پایگاه داده است که داده ها را به جای جداول از پیش تعریف شده، از اسناد جمع آوری می کند و برای ارائه اطلاعات سند، در یک قالب قابل جستجو استفاده می شود.
  • پایگاه داده ی دینامو (Dynamo DB): یک سرویس پایگاه داده ی NoSQL از AWS با تاخیر کم است که می تواند به راحتی داده های بزرگ را ذخیره و بازیابی کند و مقادیر زیادی از ترافیک را عرضه کند.
E
  • جستجوی ارتجاعی (ElasticSearch): موتور جستجوی مبتی بر جاوا و ساخته شده تحت آپاچی لوسن که جستجو و شاخص گذاری فایل ها را نزدیک به زمان واقعی (real-time) انجام می دهد و اسناد JSON را بصورت خودکار شاخص گذاری می کند.
  • سازگاری احتمالی (Eventual consistency): ایده ای با مفهوم اینکه پایگاه داده های مطابق با مدل BASE، حاوی داده هایی هستند که در طول زمان سازگار می شوند.
F
  • تحمل خطا (Fault tolerance): توانایی سیستم برای پاسخ به خرابی سخت افزار یا نرم افزار بدون مختل کردن سیستم های دیگر.
G
  • مخزن گراف (Graph store): نوعی پایگاه داده که برای مدیریت موجودیت هایی با تعداد روابط بالا استفاده می شود. برای مثال گراف های اجتماعی (social graphs)، سیستم های برچسب گذاری (tag systems) و یا هر دامنه ای که شامل لینک های زیادی باشد. این نوع پایگاه داده ها برای مسیریابی و خدمات تعیین مکان نیز استفاده می شوند.

H

  • هدوپ یا هادوپ (Hadoop): چارچوب بنیاد نرم افزار آپاچی که بطور ویژه برای انجام محاسبات با مقیاس پذیری بالا، داده های حجیم و توزیع شده توسعه داده شده است. هدوپ در درجه ی اول بصورت موثری برای پردازش دسته ای مجموعه داده های بزرگ استفاده می شود.
  • دسترسی بالا (High availability, HA): حتی پس از شکست های جزئی، دسترسی به منابع در سیستم کامپیوتری را به طور مداوم نشان می دهد. این را می توان با سخت افزار اضافی (redundant hardware)، راه حل های نرم افزاری و سایر استراتژی های خاص به دست آورد.
  • تراکنش ترکیبی/ پردازش تحلیلی (Hybrid transaction/ analytical processing) : به نوعی معماری نرم افزاری گفته می شود که در واقع مانع و فاصله ی بین پردازش و تحلیل تراکنش را از بین می برد و تصمیم گیری در زمان واقعی را ممکن می سازد.
I
  • In-memory: اصطلاح صنعتی تعمیم یافته ای است که به توصیف ابزار مدیریت داده ای می پردازد که داده را بجای هارد دیسک یا درایو های حالت جامد، در RAM یا فلش مموری بارگذاری می کند.
J
  • اتصال (Join): یک دستور در SQL است که ستون های یک یا چند جدول در یک پایگاه داده رابطه ای را با استفاده از مقادیر مشترک برای هر یک ترکیب می کند.
  • ژورنالینگ (Journaling): به ثبت همزمان و زمان واقعی تمام بروز رسانی داده ها در پایگاه داده اشاره دارد. گزارش های بدست آمده به عنوان یک دنباله حسابرسی هستند که می توانند در صورت خراب یا حذف شدن داده های اصلی برای بازسازی پایگاه داده مورد استفاده قرار گیرند.
  • JPA (Java Persistence API): یک استاندارد در جاوا برای دسترسی، مدیریت، پایداری و ماندگاری داده بین اشیاء یا کلاس های جاوا و پایگاه داده های رابطه ای است.
K
  • مخزن کلید – مقدار (Key-value store): نوعی پایگاه داده که داده را در جفت های ساده ی کلید – مقدار ذخیره می کند. این نوع دخیره سازی برای عملیات خواندن و نوشتن جزئی، پیوسته و بطور بالقوه فرّار استفاده می شود.
L
  • LMDB (Lightning memory-mapped database): پایگاه داده ای با ساختار B-Tree و copy-on-write که کاملا تبادلی، سازگار با خاصیت ACID و کم حجم است که از کنترل همزمانی چندگانه (Multiversion concurrency control, MVCC) نیز استفاده می کند.
  • Log-structured merge (LSM) tree: یک ساختار داده ای است که داده ها را با استفاده از بخش های تغییرناپذیر نوشته، ویرایش و یا اجرا می کند که معمولا در سطوحی سازماندهی می شوند. استراتژی های متعددی برای این سطوح وجود دارد، اما سطح اول معمولا شامل آخرین اطلاعات و اطلاعات فعال است.
M
  • مدل برنامه نویسی نگاشت/کاهش (MapReduce): یک مدل برنامه نویسی که توسط Google برای مقیاس پذیری و توزیع بالا بر روی خوشه های چندگانه برای پردازش داده ها ایجاد شده است.
  • کنترل همزمانی چندگانه (Multiversion concurrency control, MVCC): یک روش برای رسیدگی به شرایطی که ماشین ها به طور همزمان به خواندن و نوشتن در پایگاه داده می پردازند.
N
  • N1QL (Non-first normal form query language): توسعه یافته توسط Couchbase، که یک زبان پرس و جوی متعارف و مدل داده ی مبتنی بر JSON برای پایگاه داده ی توزیع شده را ارائه می دهد.
  • NewSQL: یک توصیفگر مختصرنویسی شده برای سیستم های پایگاه داده ی رابطه ای که مقیاس پذیری و عملکرد افقی را با سیستم های NoSQL فراهم می کند.
  • NoSQL: یک کلاس از سیستم های پایگاه داده که شامل ابزارهای دیگر جستجو در خارج از SQL سنتی است و از ساختارهای رابطه ای استاندارد استفاده نمی کند.
O
  • نگاشت رابطه به شی (Object-relational mapper, ORM): یک ابزار که یک لایه انتزاعی پایگاه داده را برای تبدیل داده ها بین سیستم های نوع ناسازگار با استفاده از زبان های برنامه نویسی شی گرا به جای زبان پرس و جوی پایگاه داده فراهم می کند.
P
  • موازات (Parallelism): حالتی که سیستم های عامل قادر به کار موثر با یکدیگر برای حل مشکلی هستند.
  • ماندگاری (Persistence): وقتی داده در یک پایگاه داده ذخیره شد، پایدار است و از بین نمی رود. مگر آنکه توسط سیستم پایگاه داده تغییر کند. البته باید در نظر داشت که یک سیستم مدیریت پایگاه داده (DBMS) با استفاده از راهکارهای مختلف و ابزارهایی که در اختیار مدیر سیستم قرار می دهد، این اطمینان خاطر را ایجاد می نماید.
  • پایداری چند زبانی (Polyglot persistence): اشاره به استفاده سازمان از چندین فناوری ذخیره سازی داده برای انواع مختلف داده ها است.
R
  • پایگاه داده ی رابطه ای (Relational database): پایگاه داده ای که به مجموعه داده های مربوط به هم در جداول، رکورد ها و ستون ها ساختار می دهد.
  • تکرار (Replication): اصطلاحی است برای به اشتراک گذاری داده ها به منظور اطمینان از همبستگی بین منابع اضافی (redundant resources).
S
  • مقیاس پذیری (Scalability): توانایی یک پایگاه داده یا سیستم دیگر که قادر به گرفتن منابع و ظرفیت بیشتر و اتصال چندگانه به منظور بهبود بهره وری است.
  • طرح، شِما (Schema): یک اصطلاح برای ساختار داده ی منحصر به فرد یک پایگاه داده است.
  • بخش بندی (Sharding): همچنین به عنوان "پارتیشن بندی افقی" نیز شناخته می شود. در این حالت یک پایگاه داده به چند قسمت تقسیم می شود که این کار معمولا برای بهبود سرعت و قابلیت اطمینان یک برنامه انجام می شود.
  • سازگاری قوی (Strong consistency): یک مفهوم پایگاه داده که اشاره به عدم توانایی انجام تراکنش هایی دارد که نقض کننده ی قوانین پایگاه داده برای اعتبار داده ها هستند.
  • زبان پرس و جوی ساخت یافته (Structured query language, SQL): یک زبان برنامه نویسی که برای مدیریت و دستکاری داده ها طراحی شده است و به طور عمده در پایگاه داده های رابطه ای استفاده می شود.
W
  • مخزن ستونی گسترده (Wide-column store): همچنین با نام "مخازن BigTable" به دلیل ارتباط آنها با پایگاه داده اولیه BigTable گوگل، بدین نام نیز شناخته می شوند. این پایگاه داده ها، داده ها را در پرونده هایی ذخیره می کنند که می توانند تعداد بسیار زیادی ستون های پویا را نگه داری کنند. نام ستون ها و رکورد ها ثابت نیستند.
برچسب ها: دیتابیس, database

منبع: dzone


او دانش آموخته‌ی رشته مهندسی کامپیوتر است. مقالات علمی و تکنولوژی روز دنیا، پژوهش‌های مرتبط با فناوری را دنبال می‌کند. به برنامه‌نویسی٬ هنر٬ موسیقی٬ بازی‌های رایانه‌ای و شعر نو علاقه دارد و معتقد است هیچ چیزی در دنیای فناوری در راستای بهبود زندگی انسان غیر ممکن نیست.
اگر این مطلب برای شما مفید بوده آن را با دوستانتان به اشتراک بگذارید:

آخرین بازدید نظرات

تاکنون هیچ نظری از طرف کسی نوشته نشده است !

حروفي را که ميبينيد تايپ کنيد
اضافه کردن نظر