Mesin pencari audio dari startup Bremen mencari istilah pencarian dalam klip audio. Biasanya berfungsi, tetapi sistem masih mengalami beberapa masalah.

Pendiri Spaactor Thorsten Schoop (56) dan Christian Schrumpf (38, dari kiri)

Meneliti artikel video dan audio memakan waktu. Dibandingkan dengan teks, pencariannya lebih sulit. Hal ini berlaku tidak hanya untuk pengguna Internet pada umumnya yang ingin mencari kata dalam dokumen menggunakan fungsi pencarian Ctrl-F. Bahkan mesin pencari umum seperti Google, yang berbasis teks, tidak dapat menemukan konten gambar dan audio bergerak.

Mesin pencari Bremen Aktor spa juga mencari istilah dalam file audiovisual, mencari saluran seperti YouTube, perpustakaan media ZDF, atau podcast OMR. Menurut startup tersebut, database Spaactor saat ini berisi sekitar 1,5 juta dokumen. Setiap hasil pencarian dilengkapi dengan stempel waktu sehingga pengguna dapat langsung menuju ke istilah yang dicari. Mesin pencari ini gratis untuk perorangan.

Thorsten Schoop dan Christian Schrumpf mendirikan Spaactor GmbH pada tahun 2015. Pada akhir tahun 2017, mereka mengumpulkan apa yang mereka gambarkan sebagai “jumlah besar” dari agen internet Team Neusta yang berbasis di Bremen dan perusahaan konsultan D2D4. Startup ini saat ini mencapai penjualan bulanan lima digit dari klien bisnis. Produsen Sactor mengatakan titik impas belum tercapai.

Kami bertanya kepada salah satu pendiri Thorsten Schoop tentang model bisnis di balik mesin pencari.

Thorsten, di situs Anda pengguna dapat mencari kata-kata, misalnya di video berita atau podcast. Bagaimana cara kerjanya?

Mesin pencari kami terus-menerus mencari sumber audio visual online dengan jangkauan tertinggi dalam bahasa Jerman untuk dokumen baru. Misalnya, ketika menemukan video baru, ia mengekstrak trek audio dari file tersebut dan menggunakan pengenalan suara untuk mengubahnya menjadi transkrip, yang kemudian kami lakukan penelusuran teks lengkap. Itu semua terjadi secara otomatis.

Di banyak perpustakaan media, konten diberi tag dengan kata kunci. Teks deskriptif juga biasanya disertakan. Bukankah itu cukup?

Ada lebih banyak file video dan audio daripada yang ditemukan mesin pencari standar. Contoh Tagesschau: Rata-rata 1.500 kata ditulis dalam 15 menit waktu siaran. Teks deskriptif di perpustakaan media hanya sepanjang 50 hingga 60 kata. Kamis lalu, istilah “Kementerian Lingkungan Hidup” muncul tiga kali dalam siaran tersebut. Tidak sekali pun dalam teks online. Jadi kita bisa menemukan konten 30 kali lebih banyak dibandingkan mesin pencari biasa. Kami juga mengingat setiap lokasi pengguna kami hingga detik yang tepat. Ini menghemat waktu pencarian yang lama.

Bagaimana layanan Anda dibiayai? Anda hampir tidak dapat menemukan iklan apa pun di situs web.

Kami menghasilkan uang dari klien institusional. Ini termasuk agensi PR, lembaga penyiaran, museum atau yayasan. Mereka tertarik untuk memantau konten media atau membuat arsip non-publik mereka lebih mudah ditelusuri. Misalnya, Günther Grass Foundation memperoleh akses ke arsip audiovisualnya melalui kami.

Baca juga

Mantan bos StudiVZ meluncurkan startup AI – dengan pendanaan awal sebesar 5 juta

Spaactor bekerja cukup baik dengan istilah pencarian umum: Angela Merkel, startup scene, daisy. Namun, sistem sudah mengalami masalah dengan file yang menggunakan bahasa Austro-Jerman.

Dialek masih sulit bagi kami. Apakah suatu hari nanti kita akan memperkenalkan orang Bavaria atau Swabia tergantung pada permintaan. Kami pada dasarnya dapat membuka program kami ke bahasa apa pun. Satu-satunya pertanyaan adalah apakah itu sepadan. Kami akan segera menawarkan bahasa Inggris, kemudian bahasa Spanyol, Prancis, dan Arab direncanakan.

Bagaimana sistem Anda mempelajari bahasa baru?

Dengan memberinya sejumlah besar materi dalam bentuk audio dan teks. Misalnya, pidato parlemen bisa dijadikan bahan pelatihan karena biasanya ditranskrip. Sistem ini belajar mandiri dan diperbarui setiap hari. Kami memerlukan waktu sekitar empat bulan untuk mengembangkan model bahasa baru.

Spaactor GmbH muncul pada tahun 2015 dari perusahaan lain yang terlibat dalam pemantauan media. Mengapa terjadi pergeseran strategi?

Model perusahaan sebelumnya berada di wilayah abu-abu dalam hal hak cipta. Pengenalan ucapan sudah berperan pada saat itu; misalnya, kami mencari nama perusahaan di rekaman TV dan radio. Dengan GmbH baru dan model bisnis baru, Christian Schrumpf dan saya ingin berkonsentrasi sepenuhnya dalam mencari konten lisan yang tersedia untuk umum menggunakan teknologi pengenalan suara kami.

Institut Fraunhofer telah bekerja sama dengan ARD dalam pengenalan suara otomatis pada gambar bergerak. Google mampu menyalin model Anda. Apakah Anda takut dengan peniru?

Kalau kita makin dikenal, cepat atau lambat pasti ada penirunya. Infrastruktur kami diatur di cloud. Jadi kita perlu menggunakan opsi skala sederhana ini dalam model bisnis kita untuk berekspansi secara internasional dengan cepat.

Gambar: Spaaktor

link slot demo