स्पीचिफाई के संस्थापक ने एवरीडे एआई पॉडकास्ट के साथ एआई के भविष्य पर चर्चा की
प्रमुख प्रकाशनों में
स्पीचिफाई के संस्थापक के साथ एआई की दुनिया में गहराई से बातचीत का हिस्सा बनें, एवरीडे एआई पॉडकास्ट के साथ।
स्पीचिफाई के संस्थापक ने एवरीडे एआई पॉडकास्ट के साथ एआई के भविष्य पर चर्चा की
क्या सेलिब्रिटी आवाजें जनरेटिव एआई का भविष्य हैं? क्या एआई सुरक्षित है? स्पीचिफाई के संस्थापक और सीईओ क्लिफ वेट्ज़मैन ने एवरीडे एआई पॉडकास्ट के एपिसोड 152 में जॉर्डन विल्सन के साथ बैठकर इन सवालों और अधिक पर चर्चा की।
एवरीडे एआई पॉडकास्ट
एवरीडे एआई पॉडकास्ट एक लोकप्रिय मुफ्त दैनिक लाइवस्ट्रीम, पॉडकास्ट, और न्यूज़लेटर है जो आम लोगों को एआई के साथ अपने करियर को बढ़ाने में मदद करता है। यह पॉडकास्ट न केवल श्रोताओं को जनरेटिव एआई के तेजी से बढ़ते क्षेत्र से संबंधित नवीनतम टिप्स और रुझानों से अपडेट रखता है, बल्कि यह भी सुनिश्चित करता है कि वे एआई का लाभ उठाकर सफलता प्राप्त कर सकें। अप्रैल 2023 में लॉन्च होने के बाद से, एवरीडे एआई पॉडकास्ट ने 22,000 श्रोताओं और 7,800 दैनिक ईमेल न्यूज़लेटर सब्सक्राइबर्स को आकर्षित किया है जो एआई अंतर्दृष्टि और रणनीतियों को सीखना चाहते हैं ताकि वे स्मार्ट तरीके से काम कर सकें, न कि कठिन तरीके से, और कृत्रिम बुद्धिमत्ता की मदद से अपनी सफलता को नई ऊंचाइयों तक ले जा सकें।
स्पीचिफाई की कहानी
क्लिफ वेट्ज़मैन ने मूल रूप से स्पीचिफाई को कॉलेज में डिस्लेक्सिया के साथ संघर्ष करने के बाद विकसित किया और पाया कि अधिकांश पाठ्यपुस्तकों के ऑडियोबुक नहीं होते। आज, यह दुनिया का #1 टेक्स्ट टू स्पीच ऐप है, जिसमें 150,000 से अधिक पांच सितारा समीक्षाएं और 25+ मिलियन उपयोगकर्ता हैं। यह इतना लोकप्रिय कैसे हुआ कि यहां तक कि स्नूप डॉग भी कंपनी के साथ साझेदारी करना चाहते थे? वेट्ज़मैन ने इस और बहुत कुछ पर चर्चा की एवरीडे एआई पॉडकास्ट के एपिसोड 152 में जो सोमवार, 27 नवंबर को लाइव हुआ।
स्पीचिफाई कैसे काम करता है
वेट्ज़मैन ने बताया कि स्पीचिफाई दुनिया के सबसे अच्छे टेक्स्ट टू स्पीच (टीटीएस) इंजन पर आधारित है, जिसमें उच्चतम गुणवत्ता का एआई वॉयस जनरेटर है, जो किसी भी टेक्स्ट को तुरंत और सस्ते में स्पीच में बदल सकता है। एंड्रॉइड, मैक, और आईओएस ऐप, और वेबसाइट संस्करण के साथ-साथ माइक्रोसॉफ्ट एज और गूगल क्रोम एक्सटेंशन्स के साथ, स्पीचिफाई केवल डिजिटल टेक्स्ट जैसे पीडीएफ, समाचार लेख, गूगल डॉक्स, और ईमेल को पढ़ने तक सीमित नहीं है। उन्नत ओसीआर और एआई तकनीक का उपयोग करके, उपयोगकर्ता जल्दी से पाठ्यपुस्तकों, अध्ययन गाइड, हस्तलिखित नोट्स, और अन्य भौतिक दस्तावेजों की तस्वीरें खींच सकते हैं और उन्हें वास्तविक समय में जीवन्त ऑडियो फाइलों में बदल सकते हैं।
स्पीचिफाई के उपयोग के मामले और लक्ष्य
उपयोगकर्ताओं को टेक्स्ट को पढ़ने के बजाय सुनने की अनुमति देकर या स्पीचिफाई की टेक्स्ट हाइलाइटिंग सुविधा का उपयोग करते हुए पढ़ते समय, उपयोगकर्ता जानकारी को तेजी से, आसानी से, और अधिक कुशलता से अवशोषित कर सकते हैं। इसने स्पीचिफाई को छात्रों और उन व्यक्तियों के लिए एक आवश्यक एआई उपकरण बना दिया है जो सीखने के अंतर या विकलांगताओं जैसे डिस्लेक्सिया, एडीएचडी, कम दृष्टि, अंधापन, ऑटिज्म, कंसशन, और चिंता के साथ संघर्ष करते हैं।
हालांकि, जबकि स्पीचिफाई को अपने शुरुआती वर्षों में मुख्य रूप से सीखने के अंतर वाले लोगों के लिए सहायक तकनीक के रूप में उपयोग किया गया था, अब सभी प्रकार के लोग इसका उपयोग करते हैं, जिसमें, वेट्ज़मैन के अनुसार, डॉक्टर, वकील, एकाउंटेंट, सैन्य लोग, कार्यकारी, वित्त में लोग, भाषा सीखने वाले, और मल्टीटास्कर्स शामिल हैं जो अपनी उत्पादकता और पढ़ने की गति को बढ़ाना चाहते हैं, इसके उच्च गुणवत्ता वाले प्राकृतिक ध्वनि वाले आवाजों और ओसीआर तकनीक के कारण।
वास्तव में, वेट्ज़मैन ने साझा किया कि स्पीचिफाई का लक्ष्य यह सुनिश्चित करना है कि "पढ़ाई कभी भी किसी के लिए सीखने में बाधा न बने, चाहे आपकी पृष्ठभूमि कुछ भी हो।"
सेलिब्रिटी आवाजें
जैसे-जैसे स्पीचिफाई बढ़ा है, उसे कुछ बड़े नामी सेलिब्रिटीज के साथ साझेदारी करने का अवसर मिला है। इस एपिसोड में, वेट्ज़मैन और विल्सन ने चर्चा की कि स्पीचिफाई ने स्नूप डॉग के साथ कैसे साझेदारी की, जो अपनी आवाज को स्पीचिफाई की आवाज विकल्पों की भरमार में जोड़ते हैं।
वेट्ज़मैन ने बताया कि स्पीचिफाई की कई साझेदारियां तब होती हैं जब लोग जो स्वयं उत्पाद का उपयोग करते हैं, संपर्क करते हैं। वह बताते हैं कि कैसे स्नूप डॉग के एजेंट ने स्पीचिफाई से संपर्क किया, यह बताते हुए कि स्नूप अपनी आवाज का उपयोग करके अपने दर्शकों को जानकारी प्रदान करना चाहते थे। इससे वेट्ज़मैन स्नूप डॉग के इन-हाउस स्टूडियो में जाकर उनकी आवाज को वॉयस क्लोनिंग और स्पीच सिंथेसिस तकनीक के माध्यम से रिकॉर्ड और पुनः निर्मित करने के लिए प्रेरित हुए।
स्पीचिफाई की 200+ एआई आवाजों में विभिन्न भाषाओं में, जिसमें अंग्रेजी, चीनी, स्पेनिश, पुर्तगाली, और अधिक शामिल हैं, अभिनेत्री और लंबे समय से स्पीचिफाई निवेशक ग्वेनेथ पाल्ट्रो की आवाज भी एक टेक्स्ट टू स्पीच आवाज कथावाचक विकल्प है।
लेकिन इन सेलिब्रिटी आवाज विकल्पों के साथ जो सोशल मीडिया पोस्ट से लेकर शोध पत्रों तक कुछ भी पढ़ सकते हैं, स्पीचिफाई द्वारा दुरुपयोग से बचने के लिए लागू की गई सुरक्षा उपाय भी आते हैं।
एआई सुरक्षा और वॉयस क्लोनिंग
जबकि स्पीचिफाई एआई टेक्स्ट टू स्पीच टूल्स और वॉयस क्लोनिंग तकनीक के लाभों को पहचानता है, वेट्ज़मैन ने यह भी बताया कि स्पीचिफाई की सबसे बड़ी चिंताओं में से एक सामग्री निर्माताओं और लोगों की सुरक्षा करना है क्योंकि “एआई सुरक्षा अत्यंत महत्वपूर्ण है।”
सुरक्षा नीतियों को लागू करना और भी महत्वपूर्ण हो गया है क्योंकि स्पीचिफाई ने अपने टेक्स्ट टू स्पीच कार्यक्षमता का विस्तार करके नए उत्पादों जैसे स्पीचिफाई स्टूडियो को लॉन्च किया है, जो सामग्री निर्माताओं को एआई वॉयस ओवर्स, कस्टम आवाजें बनाने, वॉयस ओवर्स का अनुवाद करने, अपने काम को स्वचालित रूप से ट्रांसक्राइब करने, वीडियो संपादित करने, और एआई अवतारों का उपयोग करने की अनुमति देता है।
उदाहरण के लिए, वेट्ज़मैन बताते हैं कि स्पीचिफाई केवल उपयोगकर्ताओं को उनकी अपनी आवाज़ या उनके पास की आवाज़, जैसे कि किसी मित्र की जिसने सहमति दी हो, की नकल करने की अनुमति देता है, न कि इंटरनेट पर किसी भी आवाज़ की, ताकि दुरुपयोग और पहचान या कॉपीराइट उल्लंघन से बचा जा सके।
"हमारी सामान्य फिलॉसफी स्पीचिफाई में अधिकार मालिकों को नियंत्रण में रखती है," वेट्ज़मैन ने कहा। उन्होंने यह भी कहा कि स्पीचिफाई की एआई तकनीक सामग्री निर्माताओं जैसे ऑडियोबुक वॉयस एक्टर्स को बदलने के लिए नहीं है, बल्कि उनकी "सृजन क्षमता को बढ़ाने" के लिए है, जैसे कि उन्हें अधिक कुशलता से अधिक सामग्री बनाने में मदद करना।
इसके अलावा, वेट्ज़मैन ने खुलासा किया कि स्पीचिफाई वर्तमान में एक उत्पाद पर काम कर रहा है जो उपयोगकर्ताओं को आसानी से यह पहचानने की अनुमति देगा कि आवाज़ मानव है या एआई-जनित सिंथेटिक आवाज़ है और यदि आवाज़ नकली है, तो यह मूल रूप से कहाँ बनाई गई थी - एक सुरक्षा जो लोगों को आवाज़ घोटालों का शिकार होने से बचाने में मदद करेगी, जिसमें बुरे लोग किसी प्रियजन की आवाज़ की नकल करने के लिए आवाज़ परिवर्तक का उपयोग करते हैं।
एवरीडे एआई पॉडकास्ट पर क्लिफ वेट्ज़मैन को सुनें
यह जानने के लिए कि स्पीचिफाई का टेक्स्ट टू स्पीच एआई सीखने और सामग्री निर्माण के भविष्य को कैसे आकार दे रहा है, एवरीडे एआई पॉडकास्ट के इस विशेष एपिसोड को प्रमुख पॉडकास्ट प्लेटफॉर्म जैसे एप्पल पॉडकास्ट और स्पॉटिफाई पर सुनें या नीचे सुनें:
पॉडकास्ट टाइमस्टैम्प्स:
[00:12:50] टेक्स्ट टू वॉयस क्षेत्र में सुरक्षा
[00:18:12] टेक्स्ट टू स्पीच के उपयोग के मामले
[00:21:05] दर्शकों के प्रश्न
[00:24:10] टेक्स्ट टू स्पीच का भविष्य
[00:27:28] क्या लिखित शब्द कम प्रभावशाली हो रहा है?
[00:31:30] पेशेवरों के रूप में टेक्स्ट टू स्पीच का उपयोग
क्लिफ वेट्ज़मैन
क्लिफ वेट्ज़मैन डिस्लेक्सिया के समर्थक और स्पीचिफाई के सीईओ और संस्थापक हैं, जो दुनिया का नंबर 1 टेक्स्ट-टू-स्पीच ऐप है, जिसे 100,000 से अधिक 5-स्टार समीक्षाएं मिली हैं और यह ऐप स्टोर में न्यूज़ और मैगज़ीन श्रेणी में पहले स्थान पर है। 2017 में, वेट्ज़मैन को फोर्ब्स 30 अंडर 30 सूची में शामिल किया गया था, उनके काम के लिए जो उन्होंने सीखने की अक्षमताओं वाले लोगों के लिए इंटरनेट को अधिक सुलभ बनाने में किया। क्लिफ वेट्ज़मैन को एडसर्ज, इंक., पीसी मैग, एंटरप्रेन्योर, मैशेबल, और अन्य प्रमुख आउटलेट्स में चित्रित किया गया है।