۲۲ دی ۱۳۹۷ - ۱۰:۰۲

اضافه‌شدن بخش‌های ترجمه و نقشه به جویشگر "پارسی‌جو"

معاون پژوهشکده IT پژوهشگاه ارتباطات و فناوری اطلاعات از اضافه شدن قابلیت‌های موتور جستجوی "پارسی جو" خبر داد و گفت: این قابلیت‌ها با همکاری‌ شرکت‌های فناور و استارتاپ‌ها بوده است.
کد خبر: ۱۳۳۶
تعداد نظرات: ۵ نظر

مریم طایفه محمودی در گفت‌وگو با ایسنا راه اندازی جویشگرهای بومی را یکی از موضوعات محوری این پژوهشکده دانست و افزود: "پارسی‌جو" و "یوز" دو تا از جویشگرهای بومی هستند که تحت حمایت پژوهشگاه و با همکاری دو دانشگاه، راه‌اندازی و با همکاری برخی از شرکت‌ها به قابلیت‌های این موتورهای جستجوگر اضافه شده است.

وی اضافه شدن بخش ترجمه به این موتورها را از جمله قابلیت‌های جدید این موتور دانست و خاطر نشان کرد: به منظور تصحیح فرآیند جستجو، برخی از شرکت‌های فناوری که در حوزه نقشه فعال بودند، با پارسی‌جو در این زمینه همکاری کردند.

محمودی با بیان اینکه جویشگر پارسی‌جو یک موتور جستجوی فارسی‌زبان است، اظهار کرد: به منظور توسعه کاربردهای این موتور جستجو قابلیت ترجمه نیز به آن اضافه شد. این قابلیت موجب شده است تا کاربران به اطلاعات دیگری دسترسی داشته باشند.

معاون پژوهشکده IT پژوهشگاه ارتباطات و فناوری اطلاعات با اشاره به اهمیت راه‌اندازی موتور جستجوی فارسی، توضیح داد: در حال حاضر جویشگرهای زیادی مانند گوگل با قابلیت‌های زیاد وجود دارند و کمتر کاربران به سمت جویشگرهای فارسی‌زبان می‌روند، ولی از آنجایی که بسیاری از محتواها و مستنداتی که در سطح دانشگاه‌ها و سازمان‌ها و یا در سطح کشور وجود دارد که به دلایل فرهنگی و اجتماعی و امنیتی امکان جستجو و بازیابی اطلاعات آنها از طریق جویشگرهای موجود فراهم نیست، از این رو پیاده‌سازی جویشگرهای بومی ضروری بود.

طایفه محمودی، "کلان داده‌ها" (Big Data) را از دیگر پروژه‌های این پژوهشکده نام برد و یادآور شد: از آنجایی که روز به روز به صورت گسترده داده‌ها افزایش می‌یابند لازم است این داده‌ها مورد تحلیل و ارزیابی قرار گیرد تا داده‌های مورد نیاز استخراج شود و در اختیار کاربران قرار گیرد که در این راستا طرح "کلان‌داده‌ها" می‌تواند موثر باشد.

وی با بیان اینکه داده‌های موجود در این بخش شامل داده‌های متنی، صوتی، تصویری و ویدئویی است، ادامه داد: این داده‌ها قابل استفاده برای همه سازمان‌ها و مراکز است؛ چرا که بسیاری از این نهادها دارای داده‌های وسیعی هستند و تحلیل این داده‌ها می‌تواند قابل کاربرد برای این نهادها باشد.

محمودی در عین حال با تاکید بر اینکه ذخیره‌سازی این داده‌های کلان در یک مرکز امروزه منتفی شده است، اضافه کرد: از آنجایی که داده‌های هر دستگاه و نهادی بسیار زیاد است و از سوی دیگر تلاش می‌شود تا این داده‌های وسیع به بسترهای "ابری" و "مه" بارگذاری شود تا امکان دسترسی از هر مکانی و در هر زمانی فراهم باشد، از این رو راه‌اندازی کلان داده‌ در هر سازمانی به صورت جداگانه صورت می‌گیرد.

این محقق حوزه فناوری اطلاعات، "اینترنت اشیا" (IOT) را از دیگر موضوعات مطالعاتی این پژوهشکده نام برد و گفت: با توجه به توسعه کاربردهای این فناوری در کشور، با تعامل با شرکت‌ها و استارتاپ‌ها نسبت به تدوین نقشه راه اینترنت اشیا اقدام کردیم. ضمن آنکه آزمایشگاه‌های آن نیز در حال راه‌اندازی است.

وی بیشترین کاربرد این فناوری را در مصرف انرژی دانست.

به گزارش ایسنا، نسخه سازمانی موتور جستجوگر پارسی‌جو، قادر است میلیاردها سند با قالب‌های مختلف را خزش (Crawl) و پس از ذخیره‌سازی و نمایه‌سازی (Indexing) بر بستر توزیع شده در کمتر از یک ثانیه در آنها عملیات جستجو به زبان فارسی را انجام دهد.

سرویس جستجوی پارسی‌جو متناسب با نیاز سازمان‌ها و به‌صورت سفارشی نیز به ارائه خدمات می‌پردازد. با توجه به وجود اطلاعات متنوع در یک سازمان، سرویس مذکور نیز راهکارهای یکپارچه برای پاسخگویی به نیازهای موجود ارائه می‌دهد.

پوشش بیش از ۱۰ میلیارد سند وب (متن، تصویر، ویدئو و صوت)، مدیریت گراف وب با بیش از ۴۰۰ میلیارد یال، جستجوی همزمان روی داده با قالب‌های مختلف ورودی، ذخیره‌سازی ده‌ها میلیارد سند روی بستر Hadoop/HBase، پردازش و استخراج هوشمند اطلاعات و دانش از اسناد فارسی، جستجوی سریع در کم‌تر از یک ثانیه در مقیاس بزرگ و حجم زیاد داده (میلیاردها سند)، اتصال به واحد پردازشگر زبان (درک و گسترش پرس‌وجو، خطایابی) و جستجوی پیشرفته با فیلترهای مختلف زمان، نوع داده و مکان از قابلیت‌های این موتور جستجو است.

پارسی‌جو همچنین قابلیت بازیابی نتایج بر اساس پردازش‌های پیشرفته و هوشمند، دسته‌بندی اسناد با استفاده از روش‌های مدرن، ترکیب جستجو روی اسناد داخلی و وب، ارائه نتایج متناسب با نیاز کاربران و ارائه API سفارشی را دارد.

اخبار، آب وهوا، اوقات شرعی، تصاویر، آوا، ترجمه و نقشه از جمله خدمات این جویشگر فارسی است. 

سامانه پردازش کلان‌داده (سامپاد) نیز خدمات ذخیره‌سازی، مدل‌سازی و پردازش اطلاعات روی داده‌های حجیم را ارائه می‌دهد. این سامانه با فرمت‌های مختلف ورودی سازگار است، جستجو و پردازش اطلاعات را انجام می‌دهد، الگوها و آنومالی‌ها را کشف و دانش مورد نیاز را استخراج می‌کند. 

این سامانه قابلیت سازگاری با ورودی‌های ساختار یافته/نیافته، ذخیره‌سازی ده‌ها میلیارد داده با حجم چندین پتا بایت روی بستر Hadoop/Hbase، پردازش داده‌ها برای کشف آنومالی، خوشه‌بندی و دسته‌بندی روی بستر Spark، نمایه‌سازی سریع داده‌ها برای دسترسی سریع با استفاده از روش‌های نمایه‌سازی معکوس و پردازش‌های مربوط به گراف را دارد.

جستجوی همزمان روی داده‌ها با الگوهای مختلف ورودی، زبان پرس‌وجوی ساختار یافته، ارائه نتایج به شکل مناسب و خوانا با نمایش پویا و جستجوی ترکیبی با فیلترهای گوناگون (زمان، قالب و مکان) از دیگر قابلیت‌های این سامانه به شمار می‌رود.

ارسال نظرات
انتشار نظرات حاوی توهین، افترا و نوشته شده با حروف (فینگلیش) ممکن نیست.
نظرات مخاطبان
انتشار یافته: ۵
در انتظار بررسی: ۰
ناشناس
|
Iran (Islamic Republic of)
|
۱۵:۵۷ - ۱۳۹۷/۱۱/۱۳
جایگزین گوگل؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟!!!!!!!نمیگین خدایی نکرده یک مهندس آی تی یا چیزی شبیه این میخونه مطلبو؟؟؟؟؟؟؟؟؟؟
مثل نمایشگاه هوا فضاتون که یک مشت پیت حلبی مال 40 سال قبل و آوردین میگین دستاوردمونه؟؟؟؟؟؟؟
اینقدر نادونین؟؟؟؟؟؟؟؟؟؟؟؟؟؟؟
ناشناس
اقای مهندس آی تی یا چیزی شبیه این!
جایگزین یعنی چیزی که بجای چیز دیگه قابل استفاده است نه اینکه عینا همان باشد
هیچ دو چیزی در جهان دقیقا مثل هم نیستند
شما برو با گوگل حال کن
.
اما اگر یک مهندس آی تی یا چیزی شبیه این ، این مطلب را خواند پیشنهاد می کنم قدرت دو سرویس ترجمه ترجمان (https://targoman.ir) و گوگل (https://translate.google.com) را مقایسه کند
ناشناس
|
Iran (Islamic Republic of)
|
۱۲:۱۹ - ۱۳۹۷/۱۱/۱۴
تمام این جویشگر های پارسی برای جاسوسی از مردم ایران ساخته شده اند هیچکدام قابل اطمینان نیستند مانند آپ سروش و ....
ناشناس
چه حرف ساده انگارانه ای!!!
با فرض صحت، میشه بگی بقیه مثل گوگل چرا مجانی این کارا رو می کنند؟ نکنه برای رضای خداست؟؟
ammotarjem
من به‌عنون مترجم حرفه‌اي قبلاً زياد با گوگل ترانسليت كر كرده‌ام ولي الان به توصيه شما رفتم ترگمان را امتحان كردم واقعاً عالي است و اگر بهتر نباشد چيزي كم ندارد.
گزارش خطا
تازه ها