NLPCloud.io membantu pengembang menambahkan kecerdasan pemrosesan bahasa ke aplikasi mereka – TechCrunch


Sementara alat visual ‘tanpa kode’ membantu bisnis mendapatkan lebih banyak dari komputasi tanpa perlu pasukan teknisi internal untuk mengonfigurasi perangkat lunak atas nama staf lain, akses ke alat teknologi paling kuat – di batubara AI ‘teknologi dalam’ wajah – masih membutuhkan bantuan ahli (dan / atau keahlian internal yang mahal).

Di sinilah startup Prancis bootstrap, NLPCloud.io, melakukan perdagangan di MLOps / AIOps – atau ‘platform komputasi sebagai layanan’ (karena menjalankan kueri di servernya sendiri) – dengan fokus pada pemrosesan bahasa alami (NLP ), seperti namanya.

Perkembangan kecerdasan buatan, dalam beberapa tahun terakhir, mengarah pada kemajuan yang mengesankan di bidang NLP – sebuah teknologi yang dapat membantu bisnis meningkatkan kapasitas mereka untuk secara cerdas menangani semua jenis komunikasi dengan mengotomatiskan tugas-tugas seperti Pengenalan Entitas Bernama, analisis sentimen, teks klasifikasi, peringkasan, menjawab pertanyaan, dan penandaan Part-Of-Speech, membebaskan staf (manusia) untuk fokus pada pekerjaan yang lebih kompleks / bernuansa. (Meskipun perlu ditekankan bahwa sebagian besar penelitian NLP berfokus pada bahasa Inggris – artinya di situlah teknologi ini paling matang; sehingga kemajuan AI terkait tidak didistribusikan secara universal.)

Model NLP siap produksi (terlatih) untuk bahasa Inggris sudah tersedia ‘di luar kotak’. Ada juga kerangka kerja sumber terbuka khusus yang menawarkan bantuan dengan model pelatihan. Tetapi bisnis yang ingin memanfaatkan NLP masih perlu memiliki sumber daya DevOps dan potongan untuk mengimplementasikan model NLP.

NLPCloud.io melayani bisnis yang tidak menyukai tantangan penerapan itu sendiri – menawarkan “API NLP siap produksi” dengan janji “tidak diperlukan DevOps”.

API-nya didasarkan pada model open-source Hugging Face dan spaCy. Pelanggan dapat memilih untuk menggunakan model siap pakai yang telah dilatih sebelumnya (model ini memilih model open source “terbaik”; model tersebut tidak membuatnya sendiri); atau mereka dapat mengunggah model khusus yang dikembangkan secara internal oleh ilmuwan data mereka sendiri – yang dikatakan sebagai titik pembeda vs layanan SaaS seperti Google Natural Language (yang menggunakan model ML Google) atau Amazon Comprehend dan Monkey Learn.

NLPCloud.io mengatakan ingin mendemokratisasi NLP dengan membantu pengembang dan ilmuwan data menyelesaikan proyek ini “dalam waktu singkat dan dengan harga yang wajar”. (Ini memiliki model penetapan harga bertingkat berdasarkan permintaan per menit, yang dimulai pada $ 39 malam dan berkisar hingga $ 1.199 malam, di tingkat perusahaan, untuk satu model khusus yang berjalan pada GPU. Ia juga menawarkan tingkat gratis sehingga pengguna dapat menguji model dengan kecepatan permintaan rendah tanpa menimbulkan biaya.)

“Idenya berasal dari fakta bahwa, sebagai insinyur perangkat lunak, saya melihat banyak proyek AI gagal karena penerapan ke fase produksi,” kata pendiri tunggal dan CTO Julien Salinas. “Perusahaan sering kali berfokus pada pembuatan model AI yang akurat dan cepat, tetapi saat ini semakin banyak model sumber terbuka yang tersedia dan melakukan pekerjaan yang sangat baik… jadi tantangan terberat sekarang adalah dapat menggunakan model ini secara efisien dalam produksi. Dibutuhkan keterampilan AI, keterampilan DevOps, keterampilan pemrograman … itulah mengapa ini menjadi tantangan bagi banyak perusahaan, dan itulah mengapa saya memutuskan untuk meluncurkan NLPCloud.io. ”

Platform ini diluncurkan pada Januari 2021 dan sekarang memiliki sekitar 500 pengguna, termasuk 30 yang membayar untuk layanan tersebut. Sementara perusahaan rintisan, yang berbasis di Grenoble, di Pegunungan Alpen Prancis, adalah tim yang terdiri dari tiga orang untuk saat ini, ditambah beberapa kontraktor independen. (Salinas mengatakan dia berencana untuk mempekerjakan lima orang pada akhir tahun ini.)

“Sebagian besar pengguna kami adalah perusahaan rintisan teknologi, tetapi kami juga mulai memiliki beberapa perusahaan besar,” katanya kepada TechCrunch. “Permintaan terbesar yang saya lihat berasal dari insinyur perangkat lunak dan ilmuwan data. Terkadang berasal dari tim yang memiliki keterampilan sains data tetapi tidak memiliki keterampilan DevOps (atau tidak ingin menghabiskan waktu untuk ini). Kadang-kadang dari tim teknologi yang ingin memanfaatkan NLP di luar kotak tanpa mempekerjakan seluruh tim ilmu data. “

“Kami memiliki pelanggan yang sangat beragam, dari pendiri startup tunggal hingga perusahaan besar seperti BBVA, Mintel, Senuto… di semua sektor (perbankan, hubungan masyarakat, riset pasar),” tambahnya.

Kasus penggunaan pelanggannya mencakup perolehan prospek dari teks tidak terstruktur (seperti halaman web), melalui ekstraksi entitas bernama; dan menyortir tiket dukungan berdasarkan urgensi dengan melakukan analisis sentimen.

Pemasar konten juga menggunakan platformnya untuk pembuatan judul (melalui peringkasan). Sementara kemampuan klasifikasi teks digunakan untuk intelijen ekonomi dan ekstraksi data keuangan, menurut Salinas.

Dia mengatakan pengalamannya sendiri sebagai CTO dan insinyur perangkat lunak yang mengerjakan proyek NLP di sejumlah perusahaan teknologi membuatnya menemukan peluang dalam tantangan penerapan AI.

“Saya menyadari bahwa cukup mudah untuk membangun model NLP yang dapat diterima berkat kerangka kerja sumber terbuka yang hebat seperti spaCy dan Hugging Face Transformers tetapi kemudian saya merasa cukup sulit untuk menggunakan model ini dalam produksi,” jelasnya. “Dibutuhkan keterampilan pemrograman untuk mengembangkan API, keterampilan DevOps yang kuat untuk membangun infrastruktur yang kuat dan cepat untuk melayani model NLP (model AI pada umumnya menghabiskan banyak sumber daya), dan tentu saja keterampilan ilmu data.

“Saya mencoba mencari solusi cloud yang siap digunakan untuk menghemat waktu kerja berminggu-minggu, tetapi saya tidak dapat menemukan yang memuaskan. Intuisi saya adalah bahwa platform seperti itu akan membantu tim teknologi menghemat banyak waktu, terkadang berbulan-bulan kerja untuk tim yang tidak memiliki profil DevOps yang kuat. ”

“NLP telah ada selama beberapa dekade tetapi hingga saat ini dibutuhkan seluruh tim ilmuwan data untuk membangun model NLP yang dapat diterima. Selama beberapa tahun, kami telah membuat kemajuan luar biasa dalam hal akurasi dan kecepatan model NLP. Semakin banyak ahli yang sudah puluhan tahun berkecimpung di bidang NLP setuju bahwa NLP menjadi ‘komoditas’, ”lanjutnya. “Kerangka kerja seperti spaCy membuatnya sangat sederhana bagi pengembang untuk memanfaatkan model NLP tanpa memiliki pengetahuan ilmu data tingkat lanjut. Dan repositori open-source Hugging Face untuk model NLP juga merupakan langkah bagus ke arah ini.

“Namun menjalankan model ini dalam produksi masih sulit, dan bahkan mungkin lebih sulit daripada sebelumnya karena model baru ini sangat menuntut dalam hal sumber daya.”

Model yang ditawarkan NLPCloud.io dipilih berdasarkan performa – di mana “terbaik” berarti memiliki “kompromi terbaik antara akurasi dan kecepatan”. Salinas juga mengatakan mereka memperhatikan konteks, mengingat NLP dapat digunakan untuk berbagai kasus pengguna – karenanya mengusulkan sejumlah model agar dapat beradaptasi dengan penggunaan tertentu.

“Awalnya kami memulai dengan model yang didedikasikan untuk ekstraksi entitas saja, tetapi sebagian besar pelanggan pertama kami juga meminta kasus penggunaan lain, jadi kami mulai menambahkan model lain,” catatnya, menambahkan bahwa mereka akan terus menambahkan lebih banyak model dari dua kerangka kerja yang dipilih – “untuk mencakup lebih banyak kasus penggunaan, dan lebih banyak bahasa”.

SpaCy dan Hugging Face, sementara itu, dipilih untuk menjadi sumber model yang ditawarkan melalui API berdasarkan rekam jejak mereka sebagai perusahaan, perpustakaan NLP yang mereka tawarkan dan fokus mereka pada kerangka kerja siap produksi – dengan kombinasi yang memungkinkan NLPCloud.io untuk menawarkan pilihan model yang cepat dan akurat, bekerja dalam batas-batas trade-off masing-masing, menurut Salinas.

“SpaCy dikembangkan oleh sebuah perusahaan solid di Jerman bernama Explosion.ai. Perpustakaan ini telah menjadi salah satu perpustakaan NLP yang paling banyak digunakan di antara perusahaan yang ingin memanfaatkan NLP dalam produksi ‘nyata’ (bukan hanya untuk penelitian akademis). Alasannya adalah karena ini sangat cepat, memiliki akurasi yang tinggi di sebagian besar skenario, dan merupakan kerangka kerja beropini yang membuatnya sangat mudah digunakan oleh ilmuwan non-data (tradeoffnya adalah ia memberikan kemungkinan penyesuaian yang lebih sedikit), ”katanya.

“Hugging Face adalah perusahaan yang bahkan lebih solid yang baru-baru ini mengumpulkan $ 40 juta untuk alasan yang bagus: Mereka membuat library NLP yang mengganggu yang disebut ‘transformer’ yang meningkatkan banyak akurasi model NLP (tradeoffnya adalah sangat intensif sumber daya)) . Ini memberikan kesempatan untuk mencakup lebih banyak kasus penggunaan seperti analisis sentimen, klasifikasi, peringkasan… Selain itu, mereka membuat repositori sumber terbuka yang memudahkan untuk memilih model terbaik yang Anda perlukan untuk kasus penggunaan Anda. ”

Sementara AI berkembang pada klip dalam trek tertentu – seperti NLP untuk bahasa Inggris – masih ada peringatan dan potensi jebakan yang melekat pada otomatisasi pemrosesan dan analisis bahasa, dengan risiko mendapatkan kesalahan atau lebih buruk. Model AI yang dilatih pada data yang dihasilkan manusia, misalnya, telah ditunjukkan mencerminkan bias dan prasangka yang tertanam dari orang-orang yang menghasilkan data yang mendasarinya.

Salinas setuju NLP terkadang menghadapi “masalah bias”, seperti rasisme dan misogini. Tapi dia mengungkapkan keyakinannya pada model yang mereka pilih.

“Seringkali tampaknya [bias in NLP] karena data yang mendasari yang digunakan untuk melatih model. Ini menunjukkan bahwa kita harus lebih berhati-hati tentang asal data ini, ”katanya. “Menurut pendapat saya, solusi terbaik untuk mengatasi hal ini adalah komunitas pengguna NLP harus secara aktif melaporkan sesuatu yang tidak pantas saat menggunakan model tertentu sehingga model ini dapat dijeda dan diperbaiki.”

“Bahkan jika kami meragukan adanya bias seperti itu dalam model yang kami usulkan, kami mendorong pengguna untuk melaporkan masalah tersebut kepada kami sehingga kami dapat mengambil tindakan,” tambahnya.

Posted By : Togel Online