Zrobiliśmy to, bo
sami mieliśmy listę do czytania.
Trzy osoby. Małe studio przy Mass Ave w Cambridge. Pies o imieniu Sigma, który śpi pod biurkiem.
Zaczęliśmy latem 2023, bo mieliśmy ten sam problem co wszyscy: lista do czytania rosła, a czasu ubywało. Otwarte karty, artykuły w Pocket, folder zakładek, do którego nikt nie zaglądał. Obietnice dane sobie w przyszłości, które nigdy się nie pojawiły.
Więc zbudowaliśmy coś, co czyta teksty na głos. Nie głosem bota z obsługi klienta. Głosami, których naprawdę chce się słuchać. Kimś, kto brzmi, jakby przeczytał tekst przed tobą. Kimś, kto robi pauzę tam, gdzie ty byś ją zrobił.
Pierwsza wersja była brzydka. Jeden głos, jeden artykuł naraz, przycisk "make mp3". Daliśmy to pięćdziesięciu znajomym. Dziennikarzom, biegaczom, kilku niewidomym czytelnikom, którzy odpisali nam i powiedzieli, co naprawić. Większość tego, co jest teraz w produkcie, wzięła się z tych pierwszych maili.
Zespół wciąż jest mały. Trzy osoby na pełen etat. Paru inżynierów od głosu na kontrakcie. Jeszcze bez inwestorów. Przez pierwszy rok przejedliśmy własne oszczędności i odłożyliśmy je z powrotem z przychodu. Lubimy to tak.
Hear The Web to nie startup udający studio. Wypuszczamy, kiedy jest gotowe. Sami czytamy artykuły, zanim wytrenujemy na nich głos. Sami odpisujemy na maile. Kiedy się rejestrujesz, jedno z nas trojga pewnie to zobaczy.
Trzy lata, krótko.
Trzy osoby.
Jeden pies w studio.
Delphine P.
voice design · współzałożycielka
Reżyserowała lektorów audiobooków w Paryżu. Prowadzi bibliotekę głosów i silnik frazowania. Napisała większość naszego style guide\'a.
Mats V.
engineering · współzałożyciel
Dziesięć lat speech ML. Wcześniej w laboratorium badawczym w Sztokholmie. Odpowiada za pipeline renderu, trening modeli i to, że długie teksty się nie zacinają.
Rafi K.
cała reszta · współzałożyciel
Design, aplikacje, rozliczenia, strona, skrzynka wsparcia. Jeśli do nas piszesz, odpowie pewnie Rafi. Jeśli dostaniesz zimną odpowiedź z formularza, nakrzycz na Rafiego.
Kilka rzeczy, których się trzymamy.
- Głosy przed funkcjami. Jeden dobry głos bije dziesięć przeciętnych. Wypuściliśmy sześć, zanim wypuściliśmy jakąkolwiek funkcję.
- Nie trenujemy na twoich treściach. Artykuły, które renderujesz, nigdy nie są używane do trenowania niczego. Istnieją tyle, ile trzeba, żeby stać się audio. Potem znikają.
- Dostępność nie jest funkcją. Osoby słabowidzące były naszymi pierwszymi testerami. Cokolwiek u nich nie działa, nie wychodzi.
- Free zostaje darmowe. Trzy artykuły dziennie. Żadnych sztuczek z trialem. Jeśli nigdy nam nie zapłacisz, dalej słuchasz.
- Sami odpisujemy na maile. Naprawdę.
===============================================================================