Sürükleyip bırakın veya bir ses dosyası yapıştırın - MP3, WAV, M4A, AAC, OGG veya FLAC, dosya başına 2 GB’a kadar - ve anında bir transkript, bir yapay zeka özeti ve soru sorabileceğiniz bir sohbet kutusu elde edin. Yükleme, tarayıcıdaki tek bir bırakma bölgesinden geçer; dosya geldiği anda işleme başlar. Çıktılar, zaman damgalı bir transkript (99 dilde), düzenleyebileceğiniz bir özet, paylaşılabilir bir oynatma bağlantısı ve ses içeriği üzerinde eğitilmiş bir yapay zeka sohbeti içerir. Yalnızca transkripsiyona mı ihtiyacınız var? Transkripsiyon aracına bakın.
Yüklemeler, GDPR uyumlu sunucularda AES-256 şifrelemesi ile yapılır. Her dosya varsayılan olarak özeldir, isteğe bağlı parola koruması ve otomatik kötü amaçlı yazılım taraması içerir.
Ses Dosyası Yükleme Hizmeti - Girdiler ve Çıktılar
Bir ses dosyası yükleyin ve hizmet dört eser döndürür: bir akış bağlantısı, tam bir transkript, yapay zeka tarafından oluşturulmuş bir özet ve kayda soru sorabileceğiniz özel bir sohbet penceresi (“İkinci konuşmacı bütçe hakkında ne söyledi?”).
Ses yükleme akışı nasıl çalışır:
- Bir dosyayı bırakma bölgesine sürükleyin, göz atmak için tıklayın veya panodan yapıştırın
- Dosya, ses dosyası yükleme hizmetine yüklenirken, transkripsiyon paralel olarak başlar
- Bir transkript, özet ve paylaşılabilir bağlantı, genellikle bir saatlik bir kayıt için bir dakika içinde kontrol panelinde görünür
Ses dosyası girişleri yükleme hizmetinin kabul ettiği:
- MP3 (herhangi bir bit hızı)
- WAV (PCM, 16/24-bit)
- M4A (MP4 kabı içinde AAC)
- AAC (ham)
- OGG (Vorbis ve Opus)
- FLAC (kayıpsız)
- Ücretli planlarda 2 GB’a kadar, ücretsiz planda 100 MB’a kadar dosyalar
Ses yükleme hizmeti, akış oynatımı sırasında kaynak bit hızını korur ve transkripsiyon için ayrı bir kopyayı yeniden örnekler. Her iki geçiş de yüklediğiniz orijinalin üzerine yazmaz.
Ücretsiz çevrimiçi bir MP3 yükleyin. Kart yok, ilk dosya için kayıt yok. Bir ses dosyasını sayfaya bırakın ve transkript saniyeler içinde görünür.
Bir Ses Dosyası Yükledikten Sonra Ne Elde Edersiniz
Her yükleme, daha sonra geri dönebileceğiniz tek bir işlenmiş kayıt üretir. Kayıt aynı anda dört şey içerir: orijinal dosya (indirilebilir), konuşmacı etiketleri ve zaman damgaları olan bir transkript, yeniden oluşturabileceğiniz veya düzenleyebileceğiniz bir özet ve ses içeriğine bağlı bir sohbet dizisi.
Barındırılan oynatma bağlantısı bir yan etkidir, başlık değildir. Telefonlarda ve masaüstlerinde hesapsız çalışır, ancak bir ses yükleme hizmetinin temel değeri, sesin artık aranabilir metin olması, sohbet yoluyla sorgulanabilir olması ve TXT, SRT, VTT, DOCX veya JSON olarak dışa aktarılabilir olmasıdır.
Yüklenen bir ses dosyasının size sağladıkları:
- Zaman damgalarıyla 99 dilde transkript
- Atıfta bulunduğu zaman damgalarını gösteren yapay zeka özeti
- Kayıtla ilgili soruları yanıtlayan sohbet
- Konuşmacı etiketleri (ses birden fazla konuşmacıya sahip olduğunda)
- Altyazı için SRT ve VTT altyazı dosyaları
- İsteğe bağlı parolayla paylaşılabilir oynatma bağlantısı
- Dosya başına analizler: oynatma, coğrafi konum, tamamlanma oranı
Ses dosyası yükleme hizmeti, tek bir bırakma, pano yapıştırma veya bir dizi dosyayı (ücretli planlarda aynı anda 50’ye kadar) işler. Bunun yerine kaynak videoyu teslim etmeniz gerekiyorsa, videodan bağlantıya dönüştürücü MP4/MOV’u kapsar ve videolardan sesi çıkarma ayrı işleme için sesi dışarı çeker.
Bir Ses Yüklemesi Tarayıcıdan Transkripte Nasıl Çalışır
Bir MP3’ü sayfaya bıraktığınız anda üç şey olur: tarayıcı parçalı bir yüklemeye başlar, arka uç bir transkripsiyon işi kaydeder ve ilerlemeyi izleyebilmeniz için bir yer tutucu kaydı açılır. 50 Mbps bağlantıda bir saatlik bir MP3 için tipik zamanlamalar, çoğunlukla paralel olarak çalışan 10 saniye yükleme ve 60 saniye transkripsiyondur.
Bir ses dosyasının geçtiği adımlar:
- Bırakma alanı dosyayı kabul eder (sürükle, tıklayarak göz at veya panodan yapıştır)
- Baytlar, bağlantı düşerse devam ettirme desteği ile 5MB’lık parçalar halinde akış yapar
- Transkripsiyon ilk parçada başlar ve son parça geldikten kısa bir süre sonra biter
- Transkript, özet ve sohbet aynı kayda eklenir
Toplu yüklemeler, ücretli kullanıcıların en fazla 50 ses dosyasını sıraya almasına olanak tanır. Sıra, seri olarak değil, paralel olarak işlenir, bu nedenle 20 ders kaydından oluşan bir klasör, kabaca en yavaş olanın aldığı sürede tamamlanır.
Yükleme başına değiştirebileceğiniz ayarlar:
- Paylaşılabilir bağlantı için kişisel URL (ücretli)
- Oynatma sayfasında parola kapısı
- Transkripsiyon dili (otomatik algılama veya 99’dan birini seçin)
- Konuşmacı etiketleri açık veya kapalı
- Herkese açık, listelenmemiş veya özel görünürlük
- Blog gönderileri için gömülebilir oynatıcı snippet’i
Ücretsiz hesaplar her yüklemeyi 100 MB ile sınırlar. Ücretli planlar, tavanı 2 GB’a çıkarır ve dosyayı kuyruğun önüne taşıyan öncelikli transkripsiyonun kilidini açar.
Şimdi ses dosyası yükleme akışını deneyin. İlk dosya için kart yok, kayıt yok. Bir tane bırakın.
Neden bir ses dosyasını bir e-postaya eklemek yerine yükleyesiniz?
Posta sunucuları 25 MB’ın üzerindeki ekleri reddeder ve birçok kurumsal ağ geçidi sıkıştırılmış sesi tamamen engeller. Bir ses yükleme hizmeti, alıcıya herhangi bir tarayıcıdan oynatabileceği barındırılan bir bağlantı ve dinlemeden önce göz atabileceği bir transkript sunar - e-posta ekleri onlara indirmeleri, kaydetmeleri ve başka bir şeyde açmaları gereken bir simge verir.
İyi bir ses dosyası yükleme hizmetini genel bir dosya barındırıcısından ayıran nedir?
İyi bir ses dosyası yükleme hizmeti, genel bir barındırıcının yapmadığı üç şeyi yapar: dosyayı yazıya döker, transkripti konuşmacı etiketleriyle işaretler ve ses içeriği arasında aranabilir bir sohbet sunar. Dropbox veya Google Drive dosyayı saklar; bir ses yükleme hizmeti, dosyayı okuyabileceğiniz, arayabileceğiniz ve hakkında sorular sorabileceğiniz bir metne dönüştürür.
Ses Dosyası Yükleme Hizmetinin Otter, Notta, Sonix, Trint, Descript ile Karşılaştırılması
| Özellik | ScreenApp | Otter.ai | Notta | Sonix | Trint | Descript |
|---|---|---|---|---|---|---|
| Maksimum dosya boyutu | 2GB ücretli, 100MB ücretsiz | 5GB (İşletme) | 5GB (Pro) | 4GB | 4GB | 5GB |
| Kabul edilen formatlar | MP3, WAV, M4A, AAC, OGG, FLAC | MP3, WAV, M4A, AIFF | MP3, WAV, M4A, AAC, CAF | MP3, WAV, M4A, AAC, AIFF, FLAC | MP3, WAV, M4A, AIFF, OGG | MP3, WAV, M4A, AAC, FLAC |
| İşlem süresi (1 saatlik dosya) | ~1 dakika | 5-10 dakika | 5-8 dakika | 5-10 dakika | ~gerçek zamanlı | 5-15 dakika |
| Ücretsiz katman dakikaları | 300 dakika/ay | 300 dakika/ay | 120 dakika/ay | 30 dakika tek seferlik | Yok (yalnızca deneme) | 60 dakika/ay |
| Çıktı formatları | TXT, SRT, VTT, DOCX, JSON, MP3 akışı | TXT, DOCX, PDF, SRT | TXT, DOCX, SRT, PDF, XLSX | TXT, DOCX, SRT, VTT, JSON, PDF | TXT, DOCX, SRT, VTT, EDL | TXT, SRT, MP4, MP3 |
| Ses üzerinde AI sohbeti | Evet | Otter Sohbet (ücretli) | Notta Sohbet | Hayır | Hayır | Hayır |
| Diller | 99 | Yalnızca İngilizce (ücretli: 3) | 58 | 49 | 40+ | 22 |
Hangisi nerede uyuyor:
- Otter.ai’ye karşı: Otter, ürününü canlı toplantı yakalama ve İngilizce dilindeki aramalar üzerine inşa etti; yüklenen ses dosyaları kuyruğun arkasında dönüştürülür ve Otter Sohbet, Pro planının arkasına gizlenmiştir. Buradaki ses yükleme hizmeti, yüklenen dosyayı birinci sınıf bir vatandaş olarak ele alır ve 99 dildeki ücretsiz katmanda AI sohbeti sunar.
- Notta’ya karşı: Notta, benzer bir format aralığını kabul eder ve 58 dil listeler, ancak ücretsiz yüklemeler dosya başına 5 dakika ile sınırlıdır ve aylık 120 dakikalık bir tavanı vardır. Buradaki 300 dakikalık ücretsiz izin, sınıra ulaşmadan önce daha uzun bir podcast’i veya iki ders kaydını kapsar.
- Sonix’e karşı: Sonix, yinelenen ücretsiz bir katman olmadan saatte 10 ABD Doları tutarında kullandığın kadar öde transkripsiyon motorudur - bir kez 30 dakika alırsınız. Sonix’in AI sohbeti ve yerleşik oynatma bağlantısı yoktur; buradaki yükleme hizmeti, aynı yüklemeden sohbet, özet ve barındırılan bir bağlantı döndürür.
- Trint’e karşı: Trint, EDL dışa aktarımı ve kelimesi kelimesine modu ile haber odası iş akışlarını hedefler, ancak ücretsiz bir katman yoktur ve fiyatlandırma 80 ABD Doları/ay’dan başlar. Bir masa çalıştırmaktan ziyade ara sıra röportaj sesi yükleyen gazeteciler için, buradaki dakika başına ekonomi belirgin şekilde daha düşüktür.
- Descript’e karşı: Descript, yüklenen sesi dalga biçimini birleştirmek için kesebileceğiniz düzenlenebilir bir transkripte dönüştürür - güçlü, ancak öğrenme eğrisi diktir. Buradaki yükleme ve işleme akışı, düzenleme isteğe bağlı tutularak “dosyayı bırak, transkripti oku” ya daha yakındır.
Ses Dosyası Yükleme İşleme Süreleri (Formata Göre)
İşleme süresi, kodeke, süreye ve dosyanın mono mu stereo mu olduğuna bağlıdır. Standart işleme kuyruğunda bir saatlik bir kayıt için yaklaşık sayılar:
| Format | Tipik bit hızı | Yükleme süresi (50 Mbps) | Transkripsiyon süresi |
|---|---|---|---|
| MP3 | 128-320 kbps | 5-15 saniye | 45-70 saniye |
| WAV (PCM 16-bit) | ~1411 kbps | 60-90 saniye | 45-70 saniye |
| M4A | 96-256 kbps | 5-15 saniye | 45-70 saniye |
| AAC | 96-256 kbps | 5-15 saniye | 45-70 saniye |
| OGG (Opus) | 64-128 kbps | 3-10 saniye | 45-70 saniye |
| FLAC | ~900 kbps (kayıpsız) | 40-60 saniye | 45-70 saniye |
2 GB’lık bir WAV yüklemesi (tavan), tipik bir ev bağlantısında birkaç dakika sürer - transkripsiyonun kendisi, baytlar geldikçe paralel olarak çalışır, bu nedenle transkript genellikle son baytın gelmesinden sonraki bir dakika içinde hazır olur.
Dosya formatı karar matrisi
Yukarıdaki işleme süresi tablosu, her formatın ne kadar sürede yükleneceğini ve yazıya döküleceğini gösterir. Aşağıdaki matris farklı bir soruyu yanıtlar: İlk etapta hangi formatı kullanmalısınız? Format seçimi, ne ile kayıt yaptığınıza ve dosyayla daha sonra ne yapmayı planladığınıza bağlıdır.
| Format | En iyisi olduğu durum | Sıkıştırma | Maksimum önerilen uzunluk | Notlar |
|---|---|---|---|---|
| MP3 (320 kbps) | Genel ses, podcast’ler | Kayıplı, yüksek kalite | 4 saate kadar | Evrensel olarak desteklenir |
| WAV | Profesyonel ses, master’lar | Sıkıştırılmamış | 1-2 saat | Büyük dosyalar, en iyi kalite |
| M4A, AAC | iPhone sesli notlar, modern uygulamalar | Kayıplı, verimli | 4+ saat | Apple cihazlarında varsayılan |
| FLAC | Arşivleme, audiophile | Kayıpsız | 4+ saat | WAV’dan daha küçük, aynı kalite |
| OGG, Opus | Akış, sesli sohbet | Kayıplı, çok verimli | Değişken | Web platformlarında yaygın |
| WebM ses | Web’den çıkarılan ses | Kayıplı | 2-3 saat | Video dosyalarından |
| 3GP | Eski mobil kayıtlar | Kayıplı | 1 saat | En iyi sonuçlar için yüklemeden önce dönüştürün |
Pratik kural: Dosya bir telefondan geldiyse, M4A’nız vardır. Bir podcast DAW’sından geldiyse, muhtemelen WAV veya MP3’ünüz vardır. Bir toplantı platformunun bulut kaydından geldiyse, muhtemelen M4A’nız (Zoom) veya MP4’ten çıkarılan sesiniz (Meet, Teams) vardır. Bunların hepsi doğrudan girer. Transkripsiyon hattı, konuşma modeline geçirmeden önce her şeyi 16 kHz mono PCM dahili gösterimine normalleştirir, bu nedenle kaynak format, elde edilen transkriptin doğruluğunu değiştirmez (Nisan 2026 WER yeniden testine göre).
Yüklemeden sonra, sonucu düzenleme için transkripsiyon aracına aktarabilir veya sesiniz kaydedilmiş bir oturumun müziğiyse çıktıyı AI video özetleyicisine verebilirsiniz.
Bir Ses Dosyası Yükleme Hizmetini Kimler Kullanır
Kayıtları işleyen podcast yayıncıları. Tamamlanmış bir podcast bölümü, bir sabit sürücüye stereo WAV veya MP3 olarak iner. Dosya Apple Podcast’lere veya Spotify’a ulaşmadan önce, bölüm notları için transkripti, bölüm açıklaması için özeti ve barındırılan bir önizleme bağlantısı almak için yükleme hizmetine bırakın.
Röportaj seslerini yükleyen gazeteciler. Bir basın brifinginden bir kayıt cihazıyla çıkan muhabirler, M4A’yı doğrudan cihazdan yükleyebilir ve ses hala sıcakken aranabilir bir transkriptten alıntılar çekebilir. Konuşmacı etiketleri ve zaman damgaları, 90 dakikalık bir röportajın birkaç dakika içinde taranabilir hale geldiği anlamına gelir.
Ders kayıtlarını yükleyen öğrenciler. Telefonlar, diktafonlar ve Zoom kayıtları M4A veya MP3 dosyaları üretir. Ses dosyasının yüklenmesi, bir öğrencinin arayabileceği (“öğretim görevlisi entalpiyi ne zaman bahsetti?”), vurgulayabileceği ve çalışma notlarına yapıştırabileceği bir transkript üretir.
Dosyaları bir hattata besleyen transkripsiyon uzmanları. Serbest çalışan transkripsiyon uzmanları ve ajanslar, yükleme MP3 çevrimiçi uç noktasını bir ön geçiş olarak kullanır: AI taslak transkripti bir dakikadan kısa sürede gelir ve insan transkripsiyon uzmanı sıfırdan yazmak yerine düzeltir. Kelime düzeyinde zaman damgaları içeren JSON çıktısı, mevcut düzenleyicilere girer.
Yalnızca ses kaynaklarından altyazılar oluşturan erişilebilirlik ekipleri. Halk radyosu arşivleri, sözlü tarihler ve çağrı merkezi kayıtları genellikle yalnızca ses olarak mevcuttur. Yükleme hizmeti, bu yalnızca ses kaynaklarından SRT ve VTT dosyaları oluşturur, böylece bunlar statik bir dalga formuyla eşleştirilebilir veya WCAG 1.2.1 altında bir metin alternatifi olarak yayınlanabilir.
Ses dosyası yükleme hizmeti ayrıca klinisyenlerden gelen sesli notları, bir etiket için alışveriş yapan müzisyenlerden gelen demo parçalarını ve uyumluluk ekiplerinin bir kağıt izine ihtiyaç duyduğu eğitim seslerini de işler.
SSS
Bir ses dosyasını nasıl yüklerim?
Dosyayı bırakma alanına sürükleyin, bir dosya seçici açmak için bırakma alanına tıklayın veya panodan ses yapıştırın. Ses dosyası yükleme hizmeti MP3, WAV, M4A, AAC, OGG ve FLAC’ı kabul eder. Dosyalar, ilk parça geldiği anda transkribe etmeye başlar - işlemenin başlaması için yüklemenin bitmesini beklemenize gerek yoktur.
Ses dosyası yükleme hizmeti ücretsiz mi?
Aylık ilk 300 dakika ücretsizdir. Ücretsiz hesaplar her biri 100 MB’a kadar dosya yükleyebilir; ücretli planlar bunu 2 GB’a çıkarır. Ücretsiz katman için kart gerekmez.
Yükleme hizmeti hangi ses dosyası formatlarını destekliyor?
Herhangi bir bit hızında MP3, 16 bit veya 24 bit PCM’de WAV, M4A (MP4 kapsayıcısında AAC), ham AAC, OGG (Vorbis veya Opus) ve kayıpsız ses için FLAC. Dosyanız alışılmadık bir formattaysa, hizmet sessizce yeniden kodlamak yerine yüklemeyi reddeder.
Kayıt olmadan çevrimiçi bir MP3’ü nasıl yüklerim?
Sayfayı açın, MP3’ünüzü bırakma alanına bırakın; dosya anonim olarak yüklenir ve transkribe edilir. Dosyayı saklamak, kalıcı bir bağlantıyla paylaşmak veya oturum başına limitten daha fazlasını işlemek istiyorsanız yalnızca bir hesaba ihtiyacınız vardır.
Yüklenen bir ses dosyası ne kadar büyük olabilir?
Ücretsiz katmanda 100 MB, ücretli planlarda 2 GB. 2 GB tavan, yaklaşık 30 saatlik standart MP3, üç saatlik 24 bit WAV veya sekiz saatlik FLAC’a uyar.
Yükleme tamamlandıktan sonra işleme ne kadar sürer?
Bir saatlik bir ses dosyası için yaklaşık bir dakika. Transkripsiyon, yükleme ile paralel olarak çalışır, bu nedenle açılır bölgeye tıklamaktan transkripti okumaya kadar geçen gerçek zaman genellikle tipik bir ders veya podcast için iki dakikanın altındadır.
Yüklenen ses dosyaları özel mi?
Evet. Dosyalar varsayılan olarak özeldir. AES-256 şifrelemesi hem beklemede hem de aktarımda uygulanır, dosyalar geldikten sonra kötü amaçlı yazılım taramasından geçirilir ve dosya başına parola koruması veya listelenmemiş/özel görünürlük ekleyebilirsiniz.
Aynı anda toplu olarak birden fazla ses dosyası yükleyebilir miyim?
Evet. Ücretli planlar tek bir partide 50’ye kadar ses dosyasını kabul eder ve bunları paralel olarak işler. Gösterge paneli, dosya başına bir ilerleme satırı gösterir, böylece hangi transkriptlerin önce hazır olduğunu görebilirsiniz.