وضعیت موجودی موجود
Product details
- Publisher : O'Reilly Media; 1st edition (August 6, 2013)
- Language : English
- Paperback : 94 pages
- ISBN-10 : 1449364624
-
ISBN-13 : 978-1449364625
کتاب Apache Sqoop Cookbook: Unlocking Hadoop for Your Relational Database
Integrating data from multiple sources is essential in the age of big data, but it can be a challenging and time-consuming task. This handy cookbook provides dozens of ready-to-use recipes for using Apache Sqoop, the command-line interface application that optimizes data transfers between relational databases and Hadoop.
Sqoop is both powerful and bewildering, but with this cookbook’s problem-solution-discussion format, you’ll quickly learn how to deploy and then apply Sqoop in your environment. The authors provide MySQL, Oracle, and PostgreSQL database examples on GitHub that you can easily adapt for SQL Server, Netezza, Teradata, or other relational systems.
- Transfer data from a single database table into your Hadoop ecosystem
- Keep table data and Hadoop in sync by importing data incrementally
- Import data from more than one database table
- Customize transferred data by calling various database functions
- Export generated, processed, or backed-up data from Hadoop to your database
- Run Sqoop within Oozie, Hadoop’s specialized workflow scheduler
- Load data into Hadoop’s data warehouse (Hive) or database (HBase)
- Handle installation, connection, and syntax issues common to specific database vendors
منابع کتاب کتاب Apache Sqoop Cookbook: Unlocking Hadoop for Your Relational Database
یکپارچه سازی داده ها از منابع متعدد در عصر داده های بزرگ ضروری است، اما می تواند کاری چالش برانگیز و وقت گیر باشد. این کتاب آشپزی مفید ده ها دستور العمل آماده برای استفاده از Apache Sqoop، برنامه رابط خط فرمان که انتقال داده ها را بین پایگاه های داده رابطه ای و Hadoop بهینه می کند، ارائه می دهد.
Sqoop هم قدرتمند و هم گیج کننده است، اما با فرمت حل مسئله-بحث این کتاب آشپزی، به سرعت یاد می گیرید که چگونه Sqoop را در محیط خود استقرار و سپس اعمال کنید. نویسندگان نمونههای پایگاه داده MySQL، Oracle و PostgreSQL را در GitHub ارائه میکنند که میتوانید به راحتی برای SQL Server، Netezza، Teradata یا سایر سیستمهای رابطهای تطبیق دهید.
داده ها را از یک جدول پایگاه داده به اکوسیستم Hadoop خود منتقل کنید
با وارد کردن تدریجی داده ها، داده های جدول و Hadoop را همگام نگه دارید
داده ها را از بیش از یک جدول پایگاه داده وارد کنید
با فراخوانی توابع مختلف پایگاه داده، داده های منتقل شده را سفارشی کنید
داده های تولید شده، پردازش شده یا پشتیبان گیری شده را از Hadoop به پایگاه داده خود صادر کنید
Sqoop را در Oozie، برنامهریز گردش کار تخصصی Hadoop اجرا کنید
بارگذاری داده ها در انبار داده هادوپ (Hive) یا پایگاه داده (HBase)
مسائل مربوط به نصب، اتصال و نحو را که برای فروشندگان پایگاه داده خاص رایج است، مدیریت کنید
ارسال نظر درباره کتاب Apache Sqoop Cookbook: Unlocking Hadoop for Your Relational Database