مریم طایفه محمودی در گفتوگو با ایسنا راه اندازی جویشگرهای بومی را یکی از موضوعات محوری این پژوهشکده دانست و افزود: "پارسیجو" و "یوز" دو تا از جویشگرهای بومی هستند که تحت حمایت پژوهشگاه و با همکاری دو دانشگاه، راهاندازی و با همکاری برخی از شرکتها به قابلیتهای این موتورهای جستجوگر اضافه شده است.
وی اضافه شدن بخش ترجمه به این موتورها را از جمله قابلیتهای جدید این موتور دانست و خاطر نشان کرد: به منظور تصحیح فرآیند جستجو، برخی از شرکتهای فناوری که در حوزه نقشه فعال بودند، با پارسیجو در این زمینه همکاری کردند.
محمودی با بیان اینکه جویشگر پارسیجو یک موتور جستجوی فارسیزبان است، اظهار کرد: به منظور توسعه کاربردهای این موتور جستجو قابلیت ترجمه نیز به آن اضافه شد. این قابلیت موجب شده است تا کاربران به اطلاعات دیگری دسترسی داشته باشند.
معاون پژوهشکده IT پژوهشگاه ارتباطات و فناوری اطلاعات با اشاره به اهمیت راهاندازی موتور جستجوی فارسی، توضیح داد: در حال حاضر جویشگرهای زیادی مانند گوگل با قابلیتهای زیاد وجود دارند و کمتر کاربران به سمت جویشگرهای فارسیزبان میروند، ولی از آنجایی که بسیاری از محتواها و مستنداتی که در سطح دانشگاهها و سازمانها و یا در سطح کشور وجود دارد که به دلایل فرهنگی و اجتماعی و امنیتی امکان جستجو و بازیابی اطلاعات آنها از طریق جویشگرهای موجود فراهم نیست، از این رو پیادهسازی جویشگرهای بومی ضروری بود.
طایفه محمودی، "کلان دادهها" (Big Data) را از دیگر پروژههای این پژوهشکده نام برد و یادآور شد: از آنجایی که روز به روز به صورت گسترده دادهها افزایش مییابند لازم است این دادهها مورد تحلیل و ارزیابی قرار گیرد تا دادههای مورد نیاز استخراج شود و در اختیار کاربران قرار گیرد که در این راستا طرح "کلاندادهها" میتواند موثر باشد.
وی با بیان اینکه دادههای موجود در این بخش شامل دادههای متنی، صوتی، تصویری و ویدئویی است، ادامه داد: این دادهها قابل استفاده برای همه سازمانها و مراکز است؛ چرا که بسیاری از این نهادها دارای دادههای وسیعی هستند و تحلیل این دادهها میتواند قابل کاربرد برای این نهادها باشد.
محمودی در عین حال با تاکید بر اینکه ذخیرهسازی این دادههای کلان در یک مرکز امروزه منتفی شده است، اضافه کرد: از آنجایی که دادههای هر دستگاه و نهادی بسیار زیاد است و از سوی دیگر تلاش میشود تا این دادههای وسیع به بسترهای "ابری" و "مه" بارگذاری شود تا امکان دسترسی از هر مکانی و در هر زمانی فراهم باشد، از این رو راهاندازی کلان داده در هر سازمانی به صورت جداگانه صورت میگیرد.
این محقق حوزه فناوری اطلاعات، "اینترنت اشیا" (IOT) را از دیگر موضوعات مطالعاتی این پژوهشکده نام برد و گفت: با توجه به توسعه کاربردهای این فناوری در کشور، با تعامل با شرکتها و استارتاپها نسبت به تدوین نقشه راه اینترنت اشیا اقدام کردیم. ضمن آنکه آزمایشگاههای آن نیز در حال راهاندازی است.
وی بیشترین کاربرد این فناوری را در مصرف انرژی دانست.
به گزارش ایسنا، نسخه سازمانی موتور جستجوگر پارسیجو، قادر است میلیاردها سند با قالبهای مختلف را خزش (Crawl) و پس از ذخیرهسازی و نمایهسازی (Indexing) بر بستر توزیع شده در کمتر از یک ثانیه در آنها عملیات جستجو به زبان فارسی را انجام دهد.
سرویس جستجوی پارسیجو متناسب با نیاز سازمانها و بهصورت سفارشی نیز به ارائه خدمات میپردازد. با توجه به وجود اطلاعات متنوع در یک سازمان، سرویس مذکور نیز راهکارهای یکپارچه برای پاسخگویی به نیازهای موجود ارائه میدهد.
پوشش بیش از ۱۰ میلیارد سند وب (متن، تصویر، ویدئو و صوت)، مدیریت گراف وب با بیش از ۴۰۰ میلیارد یال، جستجوی همزمان روی داده با قالبهای مختلف ورودی، ذخیرهسازی دهها میلیارد سند روی بستر Hadoop/HBase، پردازش و استخراج هوشمند اطلاعات و دانش از اسناد فارسی، جستجوی سریع در کمتر از یک ثانیه در مقیاس بزرگ و حجم زیاد داده (میلیاردها سند)، اتصال به واحد پردازشگر زبان (درک و گسترش پرسوجو، خطایابی) و جستجوی پیشرفته با فیلترهای مختلف زمان، نوع داده و مکان از قابلیتهای این موتور جستجو است.
پارسیجو همچنین قابلیت بازیابی نتایج بر اساس پردازشهای پیشرفته و هوشمند، دستهبندی اسناد با استفاده از روشهای مدرن، ترکیب جستجو روی اسناد داخلی و وب، ارائه نتایج متناسب با نیاز کاربران و ارائه API سفارشی را دارد.
اخبار، آب وهوا، اوقات شرعی، تصاویر، آوا، ترجمه و نقشه از جمله خدمات این جویشگر فارسی است.
سامانه پردازش کلانداده (سامپاد) نیز خدمات ذخیرهسازی، مدلسازی و پردازش اطلاعات روی دادههای حجیم را ارائه میدهد. این سامانه با فرمتهای مختلف ورودی سازگار است، جستجو و پردازش اطلاعات را انجام میدهد، الگوها و آنومالیها را کشف و دانش مورد نیاز را استخراج میکند.
این سامانه قابلیت سازگاری با ورودیهای ساختار یافته/نیافته، ذخیرهسازی دهها میلیارد داده با حجم چندین پتا بایت روی بستر Hadoop/Hbase، پردازش دادهها برای کشف آنومالی، خوشهبندی و دستهبندی روی بستر Spark، نمایهسازی سریع دادهها برای دسترسی سریع با استفاده از روشهای نمایهسازی معکوس و پردازشهای مربوط به گراف را دارد.
جستجوی همزمان روی دادهها با الگوهای مختلف ورودی، زبان پرسوجوی ساختار یافته، ارائه نتایج به شکل مناسب و خوانا با نمایش پویا و جستجوی ترکیبی با فیلترهای گوناگون (زمان، قالب و مکان) از دیگر قابلیتهای این سامانه به شمار میرود.