Ringkasan AI generatif
Dokumen ini menjelaskan fitur-fitur kecerdasan buatan (AI) generatif yang didukung BigQuery ML. Fitur-fitur ini memungkinkan Anda melakukan tugas-tugas AI BigQuery ML menggunakan Vertex AI terlatih model dasar. Tugas yang didukung meliputi:
Anda mengakses model Vertex AI untuk menjalankan salah satu fungsi tersebut dengan membuat model jarak jauh di BigQuery ML yang merepresentasikan Vertex AI, endpoint model. Setelah Anda membuat model jarak jauh melalui model Vertex AI yang ingin digunakan, Anda mengakses dengan menjalankan fungsi BigQuery ML terhadap model jarak jauh.
Pendekatan ini memungkinkan Anda menggunakan kemampuan Vertex AI model untuk menganalisis data BigQuery dengan menggunakan SQL.
Alur kerja
Anda dapat menggunakan model jarak jauh melalui model Vertex AI dan model jarak jauh melalui layanan Cloud AI beserta fungsi BigQuery ML untuk mencapai analisis data yang kompleks dan tugas AI generatif.
Diagram berikut menunjukkan beberapa alur kerja umum yang dapat Anda gunakan kemampuan bersama-sama:
AI Generatif
Anda dapat menggunakan model bahasa besar (LLM) untuk melakukan tugas seperti membuat teks perangkuman dokumen. Misalnya, Anda bisa meringkas laporan panjang, atau menganalisis sentimen dalam masukan pelanggan. Anda dapat menggunakan model bahasa Vision (VLM) untuk menganalisis konten visual seperti gambar dan video untuk tugas seperti teks visual dan tanya jawab visual. Anda dapat menggunakan model multimodal untuk melakukan tugas yang sama seperti LLM dan VLM, ditambah tugas tambahan seperti transkripsi audio dan analisis dokumen.
Untuk melakukan tugas AI generatif, Anda dapat membuat
referensi ke Vertex AI terlatih
model
dengan membuat model jarak jauh dan menentukan nama model
untuk nilai ENDPOINT
. Model Vertex AI berikut
didukung:
gemini-1.5-flash
(Pratinjau)gemini-1.5-pro
(Pratinjau)gemini-1.0-pro
gemini-1.0-pro-vision
(Pratinjau)text-bison
text-bison-32k
text-unicorn
Model Claude antropik (Pratinjau) juga didukung.
Untuk memberikan masukan atau meminta dukungan untuk model yang dipratinjau, kirim email ke [email protected].
Saat Anda membuat model jarak jauh yang mereferensikan gemini-1.0-pro-002
atau versi apa pun dari model text-bison
, Anda dapat
Anda juga dapat memilih untuk mengonfigurasi
supervised tuning
(Pratinjau) secara bersamaan.
Setelah membuat model, Anda dapat menggunakan
Fungsi ML.GENERATE_TEXT
untuk berinteraksi dengan model tersebut:
- Untuk model jarak jauh berdasarkan
gemini-1.0-pro
,text-bison
,text-bison-32k
, atau modeltext-unicorn
, Anda dapat menggunakan fungsiML.GENERATE_TEXT
dengan prompt yang Anda berikan dalam kueri atau dari kolom dalam tabel standar. - Untuk model jarak jauh berdasarkan model
gemini-1.0-pro-vision
, Anda dapat menggunakanML.GENERATE_TEXT
untuk menganalisis konten gambar atau video dari tabel objek dengan prompt sediakan sebagai argumen fungsi. - Untuk model jarak jauh berdasarkan
gemini-1.5-flash
ataugemini-1.5-pro
Anda dapat menggunakan fungsiML.GENERATE_TEXT
untuk menganalisis teks, gambar, konten audio, video, atau PDF dari tabel objek dengan meminta Anda sediakan sebagai argumen fungsi, atau Anda dapat menghasilkan teks dari prompt berikan dalam kueri atau dari kolom dalam tabel standar.
Anda dapat menggunakan
grounding
dan
atribut keamanan
saat Anda menggunakan model Gemini
dengan fungsi ML.GENERATE_TEXT
, asalkan
Anda menggunakan tabel standar untuk input. Grounding memungkinkan
Model Gemini menggunakan informasi tambahan dari internet untuk
menghasilkan respons yang
lebih spesifik dan faktual. Atribut keamanan memungkinkan
Model Gemini memfilter respons yang ditampilkannya berdasarkan
atribut yang Anda tentukan.
Semua inferensi terjadi di Vertex AI. Hasilnya disimpan di menggunakan BigQuery.
Untuk mempelajari lebih lanjut, coba
buat teks dengan fungsi ML.GENERATE_TEXT
.
Embedding
Anda dapat menggunakan penyematan untuk mengidentifikasi item yang mirip secara semantik. Sebagai contoh, Anda dapat menggunakan embedding teks untuk mengidentifikasi kemiripan dua bagian teks. Jika potongan-potongan teks tersebut mirip secara semantik, kemudian embedding terletak berdekatan satu sama lain dalam ruang vektor embedding.
Anda dapat menggunakan model BigQuery ML untuk membuat jenis embeddings,
- Untuk membuat embedding teks, Anda dapat membuat referensi ke salah satu
Vertex AI
text-embedding
atautext-multilingual-embedding
model penyematan dengan membuat model jarak jauh dan menentukan nama LLM untukENDPOINT
dengan sejumlah nilai. - Untuk membuat embedding multimodal, yang dapat menyematkan teks, gambar, dan video ke
ruang semantik yang sama, Anda bisa membuat referensi ke
LLM
multimodalembedding
dengan membuat model jarak jauh dan menentukan Nama LLM untuk nilaiENDPOINT
. Fitur ini ada dalam pratinjau lebih lanjut. - Untuk membuat embedding bagi data terstruktur variabel acak independen dan terdistribusi identik (IID) data, Anda dapat menggunakan Analisis komponen utama (PCA) model atau Autoencoder model transformer. Fitur ini berada dalam pratinjau.
- Untuk membuat embedding bagi data pengguna atau item, Anda dapat menggunakan Faktorisasi matriks model transformer. Fitur ini berada dalam pratinjau.
Setelah membuat model, Anda dapat menggunakan
Fungsi ML.GENERATE_EMBEDDING
untuk berinteraksi dengannya. Untuk semua jenis model yang didukung, ML.GENERATE_EMBEDDING
bekerja dengan data di
tabel standar. Untuk multimodal
model penyematan, ML.GENERATE_EMBEDDING
juga berfungsi dengan
konten dalam tabel objek. Untuk remote
model, semua inferensi terjadi di Vertex AI. Untuk jenis model lainnya,
maka semua inferensi
terjadi di BigQuery. Hasilnya disimpan di
menggunakan BigQuery.
Untuk mempelajari lebih lanjut, coba buat
embedding teks,
penyematan gambar
dan penyematan video
dengan fungsi ML.GENERATE_EMBEDDING
.
Untuk penyematan teks yang lebih kecil dan ringan, coba gunakan model TensorFlow yang telah dilatih sebelumnya, seperti NNLM, SWIVEL, atau BERT.
Untuk mengetahui informasi tentang pemilihan model terbaik untuk kasus penggunaan embedding, lihat Memilih model penyematan teks.
Langkah selanjutnya
- Buat teks menggunakan model
text-bison
dan fungsiML.GENERATE_TEXT
. - Buat teks menggunakan model
Gemini
dan fungsiML.GENERATE_TEXT
. - Buat teks menggunakan fungsi
ML.GENERATE_TEXT
dengan data Anda. - Menyesuaikan model menggunakan data Anda.
- Analisis gambar dengan model visi Gemini.
- Untuk informasi selengkapnya tentang melakukan inferensi terhadap machine learning melihat Ringkasan inferensi model.