پروژههای صوتی و سخنگو در تقسیم بندی علوم کامپیوتر در دسه هوش مصنوعی قرار میگیرد. البته امروزه سخت افزارهایی برای ایجاد سهولت پدازش صدا در بازار وجود دارند. هرچند که نسل بشر این واقعیت را بخواهد مخفی نگهدارد. اما فرمان بردار بودن نیروهای تحت تسلط برای نسل بشر همیشه خوشآیند بوده است. حال میشود تصور کرد که فرمان صوتی علاوه بر راحتتر کردن زندگی باعث ایجاد نوعی نشات در انسان میگردد.
هوش مصنوعی ( AI ) چیست؟
جدول ویژگی های مهم پروژههای صوتی و سخنگو |
💡 تعداد |
6 عدد
|
🏷️️ دسته |
پروژههای صوتی و سخنگو |
🌎 زبان |
فارسی |
🆕 بروزرسانی |
آذر ماه 1403 |
هوش مصنوعی (Artificial Intelligence) که به اختصار AI خوانده میشود. تا به حال شده دانش آموزی بسیار موفق را در کلاس خود داشته باشید. و ناخواسته او را فردی هوشمند بنامید. در تعریف واژه هوشمند چنین آمده فردی که توانایی یادگیری و باز استفاده از دادههایی که در ذهن را داشته باشد هوشمند مینامیم.
واژه هوش مصنوعی کلمه دیگری هم دارد و آن مصنوعی است. پس دستگاهی که توانایی یادگیری را داشته باشد. مفاهیمی که یاد گرفته را بتواند دوباره مورد استفاده قرار دهد.
هوش مصنوعی در سال 1857 توسط ریاضی دان مشهور جورج بول معرفی شد. همگی ما او را با محساباتش در علم جبر میشناسیم. این دانشمند خالق جبر بولی است.
در سال 1943 با اختراع اولین کامپیوترها هوش مصنوعی دانشمندان ریاضی دان و کامپیوتر را به چالش بزرگی کشید. طولی نکشید که اولین کامپیوترها توانایی بازیهایی همچون شطرنج و چکرز را داشتند. اما مشکلی در این زمینه وجود داشت. در سال ۲۰۱۶ برنامه کامپیوتری «آلفاگو» (AlphaGo) توانست بازیکن حرفهای را در بازی گو شکست دهد. اما اگر از همین کامپیوتر میخواستید رانندگی کند نمیتوانست.
پس به این نتیجه خواهیم رسید هوش مصنوعی در شاخههایی که برای آن تعریف شده است میتواند فعالیت کند نه بیشتر. ساخت برنامهای هوشمند که توان انجام هر کاری را داشته باشد تقریبا بیشتر از 100 سال دیگر زمان لازم دارد.
برای درک بهتر هوش مصنوعی این علم را به شاخههای کوچکتری تقسیم کردهاند تا قابل درک و پیشرفت باشد.
- بینایی ماشین
- یادگیری عمیق
- پردازش تصویر
- پردازش صدا
- رباتیک
- کاوش اطلاعات
عناوین بالا بخشی کلی و مختصر از هوش مصنوعی میباشند.
پردازش صدا
هدف اصلی پردازش صدا دسترسی به الگوریتمی ریاضی است. تا پس از تبدیل اصوات به کدهای عددی این کدها برای کامپیوتر قابل فهم باشند. درنتیجه این کار پردازش متن و استخراج اطلاعات از بیگ دیتاها تا حد غیرقابل تصوری راحت میگردد. تصور کنید به دادههای تمام دنیا دسترسی دارید که تقریبا24 میلیون ترافلاپ خواهد بود. حالا بین این سطح از اطلاعات دنبال یک بحث خاص هستید. میلیونها سال طول خواهد کشید. تا با نیروی انسانی اطلاعات لازم را بین این همه داده پیدا نمود. اما با وجود هوش مصنوعی و داشتن الگوریتم پردازش صدا و دیپ لیرنینگ این کار در کمتر از چند روز انجام خواهد گرفت. امروزه نسل انسان پا را فراتر از علوم مرسوم گذاشته و دست به طراحی کامپیوترهای کوانتومی گرفتند. که سرعت آنها میلیونها برابر کامپیوترهای همین دوران هستند.
پروژههای صوتی و سخنگو میتوانند جنبهی فان هم داشته باشند. و نمونهای از آن در فیلم مرد آهنی به نمایش در آمده بود. داشتن دستیاری با قابلیت کنترل از طریق فرامین صوتی برای هر مهندسی در زمینه علوم کامپیوتر یک رویا به شمار میرود. امروزه شرکتهای بزرگی همچون آمازون گوگل اپل دستیارهای صوتی با قابلیت محدود در اختیار کاربران خود قرار دادهاند.