स्वतंत्र आवाज: मजकूर आवाज वाचण्यासाठी एक कार्यक्रम

हॅलो!

"ब्रेड शरीराला अन्न देतो, आणि पुस्तक मनाला" ...

पुस्तके - आधुनिक माणसाची सर्वात मौल्यवान संपत्ती. पुस्तके प्राचीन काळातील दिसतात आणि खूप महाग होते (गायींच्या गुरांसाठी एक पुस्तक बदलता येऊ शकेल!). आधुनिक जगात, पुस्तके प्रत्येकासाठी उपलब्ध आहेत! त्यांना वाचून, आम्ही अधिक साक्षर बनतो, क्षितिज विकसित करतो, चैतन्य करतो. आणि सर्वसाधारणपणे, त्यांनी अद्याप एकमेकांना संवादासाठी ज्ञानाचा अधिक परिपूर्ण स्त्रोत शोधला नाही!

संगणक तंत्रज्ञानाच्या विकासासह (विशेषत: गेल्या 10 वर्षांमध्ये), पुस्तके वाचणेच शक्य झाले नाही, परंतु त्यांचे ऐकणेही शक्य आहे (म्हणजेच आपण त्यांना एखाद्या विशिष्ट कार्यक्रमात नर किंवा मादी स्वरूपात वाचू शकता). व्हॉइस ऍक्टिंग टेक्स्टसाठी मी सॉफ्टवेअर टूल्सबद्दल आपल्याला सांगू इच्छितो.

सामग्री

  • लेखन सह संभाव्य समस्या
    • भाषण इंजिन
  • व्हॉइसद्वारे मजकूर वाचण्यासाठी प्रोग्राम
    • आयव्होन रीडर
    • बालाबोल्का
    • आयसीई बुक रीडर
    • बोलणारा
    • Sakrament बोलणारा

लेखन सह संभाव्य समस्या

प्रोग्रामच्या सूचीवर जाण्यापूर्वी, मी सामान्य समस्येवर लक्ष केंद्रित करू इच्छितो आणि जेव्हा प्रोग्राम मजकूर वाचू शकत नाही तेव्हा प्रकरणांवर विचार करू इच्छितो.

वस्तुस्थिती अशी आहे की व्हॉइस इंजिन आहेत, ते वेगवेगळ्या मानके असू शकतात: एसएपीआय 4, एसएपीआय 5 किंवा मायक्रोसॉफ्ट स्पीच प्लॅटफॉर्म (मजकूर चालविण्यासाठी बहुतेक कार्यक्रमांमध्ये, या साधनाची निवड आहे). म्हणून, लॉजिकल आहे की व्हॉइस वाचण्यासाठी प्रोग्राम व्यतिरिक्त, आपल्याला एक इंजिनची आवश्यकता आहे (ते यावर अवलंबून असेल, आपण कोणत्या भाषेत वाचले पाहिजेत, कोणत्या आवाजात: नर किंवा मादी इ.).

भाषण इंजिन

इंजिन विनामूल्य आणि व्यावसायिक असू शकतात (अर्थात, ध्वनि प्रजनन सर्वोत्तम गुणवत्ता व्यावसायिक इंजिनांद्वारे प्रदान केली जाते).

एसएपीआय 4. साधनांची लेगेसी आवृत्ती. आधुनिक पीसीसाठी जुने आवृत्त्या वापरण्याची शिफारस केलेली नाही. एसएपीआय 5 किंवा मायक्रोसॉफ्ट स्पीच प्लॅटफॉर्मकडे पाहणे चांगले आहे.

एसएपीआय 5. मॉडर्न स्पीच इंजिन्स, दोन्ही विनामूल्य आणि पेड आहेत. इंटरनेटवर, आपण डझनभर SAPI 5 भाषण इंजिने (मादी आणि पुरुष दोन्ही आवाजात) शोधू शकता.

मायक्रोसॉफ्ट स्पीच प्लॅटफॉर्म हे अशा साधनांचा एक संच आहे जे विविध अनुप्रयोगांच्या विकासकांना मजकूरात आवाज रूपांतरित करण्याची क्षमता लागू करण्याची परवानगी देते.

भाषण संश्लेषक कार्य करण्यासाठी, आपल्याला स्थापित करणे आवश्यक आहे:

  1. मायक्रोसॉफ्ट स्पीच प्लॅटफॉर्म - प्लॅटफॉर्मचा रनटाइम - सर्व्हर बाजू, प्रोग्रामसाठी API प्रदान करीत आहे (x86_SpeechPlatformRuntime SpeechPlatformRuntime.msi फाइल).
  2. मायक्रोसॉफ्ट स्पीच प्लॅटफॉर्म - रनटाइम भाषा - सर्व्हरच्या बाजूसाठी भाषा. सध्या 26 भाषा आहेत. तसे, रशियन खूप आहे - अॅलेनाची आवाज (फाइल नाव "MSSpeech_TTS_" ने सुरू होते ...).

व्हॉइसद्वारे मजकूर वाचण्यासाठी प्रोग्राम

आयव्होन रीडर

वेबसाइट: ivona.com

मजकूर ध्वनीसाठी सर्वोत्तम कार्यक्रमांपैकी एक. आपल्या पीसीला txt स्वरूपात फक्त साधी फायली वाचण्याची परवानगी देत ​​नाही, तर बातम्या, आरएसएस, इंटरनेटवरील कोणत्याही वेब पृष्ठे, ई-मेल इत्यादी देखील वाचू देते.

याव्यतिरिक्त, हे आपल्याला मजकुराच्या एका MP3 फाइलमध्ये रूपांतरित करण्यास अनुमती देते (नंतर आपण कोणत्याही फोनवर किंवा एमपी 3 प्लेयरवर डाउनलोड करू शकता आणि जाता जाता ऐकू शकता). म्हणजे आपण स्वत: ऑडिओ पुस्तके तयार करू शकता!

आयव्हीओएनए प्रोग्रामचा आवाज वास्तविक गोष्टींप्रमाणेच आहे, उच्चारण उच्चारणे पुरेसे वाईट नाही, ते अडखळत नाहीत. तसे, परदेशी भाषेचा अभ्यास करणार्या लोकांसाठी कार्यक्रम उपयुक्त ठरु शकतो. त्याबद्दल धन्यवाद, आपण त्या किंवा इतर शब्दाचे योग्य उच्चारण ऐकू शकता.

हे एसएपीआय 5 चे समर्थन करते, तसेच ते बाह्य अनुप्रयोगांसह चांगले (उदाहरणार्थ, ऍपल इट्यून्स, स्काईप) सहकार्य करते.

उदाहरण (माझ्या अलीकडील लेखातील एक लिहा)

मायनेस: काही अपरिचित शब्द अयोग्य उच्चार आणि छंदाने वाचले जातात. सर्वसाधारणपणे ऐकण्यासाठी पुरेसे वाईट नाही, उदाहरणार्थ, एखाद्या लेक्चर / पाठात जाताना इतिहासाच्या पुस्तकातून परिच्छेदापर्यंत - त्याहूनही अधिक!

बालाबोल्का

वेबसाइटः क्रॉस- प्लस- aa.ru/balabolka.html

"Balabolka" कार्यक्रम प्रामुख्याने मोठ्याने मजकूर फायली वाचण्यासाठी उद्देश आहे. खेळासाठी, व्हॉइस इंजिन्स (भाषण सिंथेसाइझर्स) च्या व्यतिरिक्त आपल्याला आवश्यक आहे.

स्पीच प्लेबॅक कोणत्याही मल्टीमीडिया प्रोग्राममध्ये ("प्ले / पॉझ / थांबवा") आढळणार्या मानक बटनांचा वापर करून नियंत्रित केला जाऊ शकतो.

प्लेबॅक उदाहरण (समान)

विसंगत: काही अपरिचित शब्द चुकीचे वाचतात: तणाव, छंद. कधीकधी, ते विरामचिन्हे चिन्ह वगळतात आणि शब्दांमध्ये विराम देत नाहीत. पण सर्वसाधारणपणे आपण ऐकू शकता.

तसे, ध्वनी गुणवत्तेवर जोरदार भाषण इंजिनवर अवलंबून असते, म्हणून, त्याच प्रोग्राममध्ये, प्लेबॅक आवाज लक्षणीय फरक असू शकतो!

आयसीई बुक रीडर

वेबसाइट: ice-graphics.com/ICEReader/IndexR.html

पुस्तकांसोबत काम करण्यासाठी उत्कृष्ट कार्यक्रम: वाचन, कॅटलॉगिंग, आवश्यक शोध, इत्यादी. मानक कागदपत्रांव्यतिरिक्त इतर प्रोग्राम्स (TXT-HTML, HTML-TXT, TXT-DOC, DOC-TXT, PDB-TXT, LIT-TXT द्वारे वाचले जाऊ शकतात) , एफबी 2-टीXT, इत्यादी.) आयसीई बुक रीडर फाइल स्वरूपनांचे समर्थन करतेः .लिट, .CHM आणि .ePub.

याव्यतिरिक्त, आयसीई बुक रीडर केवळ वाचण्यासाठीच नव्हे तर उत्कृष्ट डेस्कटॉप लायब्ररी देखील अनुमती देते:

  • आपल्याला संग्रहित करण्याची, प्रक्रिया करण्यास, पुस्तकांची सूची करण्यास अनुमती देते (250 दशलक्ष प्रती!);
  • आपल्या संग्रहाची स्वयंचलित ऑर्डरिंग;
  • आपल्या "डंप" पुस्तकातून त्वरित शोध (विशेषतः आपल्याकडे बरेच सूचिबद्ध साहित्य असल्यास महत्त्वपूर्ण);
  • आयसीई बुक रीडर डेटाबेस इंजिन या प्रकारच्या बर्याच प्रोग्रामपेक्षा श्रेष्ठ आहे.

प्रोग्राम आपल्याला व्हॉइसद्वारे मजकूराची आवाजाची अनुमती देतो.

हे करण्यासाठी, प्रोग्राम सेटिंग्जवर जा आणि दोन टॅब कॉन्फिगर करा: "मोड" (व्हॉइसद्वारे वाचन निवडा) आणि "उच्चार संश्लेषणाचा मोड" (भाषण इंजिन स्वत: निवडा).

बोलणारा

वेबसाइट: वेक्टर-ski.ru/vecs/govorilka/index.htm

"टॉकर" प्रोग्रामची मुख्य वैशिष्ट्ये:

  • व्हॉइसद्वारे मजकूर वाचणे (दस्तऐवज txt, दस्तऐवज, आरटीएफ, एचटीएमएल इ. उघडते);
  • आपल्याला वाढीव गतीसह (*. .WAV, * .एमपी 3) पुस्तकांतील मजकूराचा मजकूर रेकॉर्ड करण्यास अनुमती देते - उदा. अनिवार्यपणे इलेक्ट्रॉनिक ऑडिओ बुक तयार करणे;
  • चांगले वाचन गती नियंत्रण कार्ये;
  • स्वयं स्क्रोल;
  • शब्दसंग्रह भरण्याची क्षमता;
  • डॉसच्या काळातील जुन्या फाइल्सचे समर्थन करते (बरेच आधुनिक प्रोग्राम या एन्कोडिंगमधील फायली वाचू शकत नाहीत);
  • फाइल आकार ज्यापासून प्रोग्राम मजकूर वाचू शकतो: 2 गीगाबाइट पर्यंत;
  • बुकमार्क्स बनविण्याची क्षमता: जेव्हा आपण प्रोग्राममधून बाहेर पडता तेव्हा ते स्वयंचलितपणे ज्या ठिकाणी कर्सर थांबले तेथे ते स्वयंचलितपणे लक्षात ठेवते.

Sakrament बोलणारा

वेबसाइट: sakrament.by/index.html

सक्रॅमेंट टॉकरसह, आपण आपला संगणक बोलणार्या ऑडिओ बुकमध्ये बदलू शकता! सक्रॅमेंट टॉकर प्रोग्राम आरटीएफ आणि टीएफटी स्वरूपाचे समर्थन करते, ते स्वयंचलितपणे फाईलचे एन्कोडिंग ओळखू शकते (संभाव्यत: कधीकधी असे लक्षात आले की काही प्रोग्राम्स मजकूरऐवजी "क्रॉस्कोकॉस्क" सह फाइल उघडतात, म्हणूनच सक्रॅमेंट टॉकरमध्ये हे शक्य नाही!).

याव्यतिरिक्त, सॅक्रामेंट टॉकर आपल्याला मोठ्या फायली मोठ्या प्रमाणात प्ले करण्यास अनुमती देते, त्वरीत काही फायली शोधतात. आपण केवळ आपल्या संगणकावर व्हॉइस केलेला मजकूर ऐकूच शकत नाही परंतु एमपी 3 फाइल म्हणून देखील जतन करू शकता (जे आपण नंतर कोणत्याही प्लेअर किंवा फोनवर कॉपी करू शकता आणि त्यास पीसीवरून दूर ऐकू शकता).

सर्वसाधारणपणे, हा एक चांगला कार्यक्रम आहे जो सर्व लोकप्रिय व्हॉइस इंजिनला समर्थन देतो.

आज सर्व आहे. आजचे कार्यक्रम अद्याप पूर्णपणे (100% गुणात्मक) मजकूर वाचू शकत नाहीत तरीही एखादा वाचक कोण ते वाचतो हे निर्धारित करू शकत नाही: प्रोग्राम किंवा व्यक्ती ... परंतु मला वाटते की काहीवेळा प्रोग्राम येथे येतील: संगणक शक्ती वाढतात, इंजिनांचे प्रमाण वाढते (अधिक आणि अधिक नवीन आणि सर्वात जटिल भाषण वळते) - याचा अर्थ असा आहे की प्रोग्रॅममधील आवाज लवकरच सामान्य माणसाच्या भाषणातून वेगळा आहे ?! vv

चांगले काम करा!

व्हिडिओ पहा: जब पतरकरत ससथन म ह सवततर आवज क दबय ज रह ह त मडय नषपकष कस हग (नोव्हेंबर 2024).