الگوریتم برت گوگل (Google BERT Algorithm) یکی از الگوریتمهای پردازش زبان طبیعی است که توسط گوگل توسعه داده شده است. نام “برت” مخفف “Bidirectional Encoder Representations from Transformers” است که به معنی “نمایش دهندههای رمزگذاری دوطرفه با استفاده از تبدیلکنندهها” است. این الگوریتم در سال ۲۰۱۸ توسط تیم پژوهشی گوگل معرفی شد و به طور گسترده از آن در سیستمهای پردازش زبان طبیعی استفاده میشود.
برت گوگل از معماری تبدیلکنندهها استفاده میکند که در سال ۲۰۱۷ توسط تیم پژوهشی گوگل معرفی شد. این تبدیلکنندهها با استفاده از لایههای خودرمزگذار (self-attention)، توانایی برقراری ارتباطات دوطرفه را در مدلهای پردازش زبان طبیعی فراهم میکنند. به عبارت دیگر، تبدیلکنندهها توانایی درک و تولید جملات زبان طبیعی با توجه به کلمات قبل و بعد از هر کلمه را دارند.
برت گوگل با استفاده از معماری تبدیلکنندهها، نمایش دهندههایی برای کلمات متن را تولید میکند. این نمایش دهندهها به صورت بردارهای یک بعدی هستند و با استفاده از مکانیزم خودرمزگذاری، معنای کلمات را با توجه به متن کلی استخراج میکنند. برت گوگل با بهرهگیری از تبدیلکنندهها و استخراج نمایش دهندهها، توانایی درک متن و انجام وظایف پردازش زبان طبیعی را دارد.
یکی از ویژگیهای منحصر به فرد برت گوگل، استفاده از مکانیزم آموزش غیرنظارتی است. این مکانیزم به الگوریتم امکان آموزش بدون نیاز به برچسبهای استاندارد را میدهد. به این صورت که برت گوگل با استفاده از متنهای بدون برچسب وجود در وب، خود را آموزش میدهد و نمایش دهندههای معنایی برای کلمات را تولید میکند. این نمایش دهندهها سپس در وظایف پردازش زبان طبیعی مورد استفاده قرار میگیرند.
الگوریتم برت گوگل باعث بهبود قابل توجهی در کارایی سیستمهای پردازش زبان طبیعی شده است. با استفاده از آن، سیستمهای ترجمه ماشینی، خلاصهساز متن، پاسخگویی به سوالات و سایر وظایف پردازش زبان طبیعی قادر به ارائه نتایج دقیقتر و بهتری هستند. برت گوگل با استفاده از مکانیزم آموزش غیرنظارتی، قادر به خودآموزش است و میتواند با توجه به حجم زیادی از دادههای وب بهبودهای مستمری کسب کند.