BigQuery Introduction
BigQuery কী এবং কিভাবে কাজ করে?
গল্প দিয়ে শুরু করি
কল্পনা করো — তুমি একটা বড় e-commerce কোম্পানির Data Analyst। তোমার কাছে ৫০ কোটি রোর অর্ডারের ডেটা আছে। বস জিজ্ঞেস করলেন: "গত বছর কোন মাসে সবচেয়ে বেশি বিক্রি হয়েছে?"
তুমি যদি সাধারণ MySQL ব্যবহার করো → হয়তো ৩-৪ ঘণ্টা লাগবে। তুমি যদি BigQuery ব্যবহার করো → মাত্র ৫-১০ সেকেন্ড!
এটাই BigQuery-র জাদু। চলো দেখি এই জাদু কিভাবে কাজ করে।
BigQuery-র মূল structure কেমন?
BigQuery-তে ডেটা তিন স্তরে থাকে। নিচে interactive diagram-এ দেখো:এখন বুঝলে structure। এবার দেখো BigQuery আসলে কিভাবে এত দ্রুত কাজ করে — এটা সবচেয়ে মজার অংশ!
BigQuery কেন এত দ্রুত? — Columnar Storage-র জাদু
সাধারণ database ডেটা row by row রাখে। BigQuery রাখে column by column। পার্থক্যটা নিচে দেখো:এখন কিভাবে একটি query চলে সেটা দেখি — query submit করলে BigQuery-র ভেতরে কী হয়?
একটি Query চললে BigQuery-র ভেতরে কী হয়?
এই interactive stepper-এ প্রতিটি ধাপ দেখো:---
BigQuery বনাম সাধারণ Database — কখন কোনটা?
| বিষয় | MySQL / PostgreSQL | BigQuery |
|---|---|---|
| ডেটার আকার | কয়েক GB পর্যন্ত ভালো | TB থেকে PB পর্যন্ত |
| Query গতি | ছোট ডেটায় দ্রুত | বড় ডেটায় অপ্রতিদ্বন্দ্বী |
| Server লাগে? | হ্যাঁ | না — Serverless |
| Real-time insert | খুব ভালো | সীমিত (streaming আলাদা) |
| খরচ | Server চলতে থাকলে টাকা যায় | শুধু query করলে টাকা যায় |
| ব্যবহার | App-এর backend ডেটা | Analytics, reporting, ML |
হাতে-কলমে: প্রথম Query চালিয়ে দেখো
BigQuery Console-এ গিয়ে এই query টি চালাও — এটি Google-এর Public Dataset, কোনো setup লাগবে না:
-- গত ১০০ বছরের সবচেয়ে জনপ্রিয় বাংলাদেশি-পরিচিত নামগুলো
SELECT
name,
SUM(number) AS মোট_সংখ্যা
FROM
`bigquery-public-data.usa_names.usa_1910_2013`
WHERE
name IN ('Ali', 'Nadia', 'Rafi', 'Sara', 'Omar')
GROUP BY
name
ORDER BY
মোট_সংখ্যা DESC;
এটি চালালে দেখবে কত কোটি রো থেকে মাত্র সেকেন্ডে ফলাফল আসছে!
মূল কথা — মনে রাখো
BigQuery-র তিনটি মূল শক্তি:
Columnar Storage → শুধু দরকারি column পড়ে, বাকিটা skip করে।
Distributed Computing → হাজার worker একসাথে কাজ করে।
Storage ও Compute আলাদা → কোনো server maintain করতে হয় না।