صورة إدراكية

https://stackoverflow.com/questions/1780277

21-09-2019
|

سؤال

حتى هنا هو مشكلتي:

لدي صورة ، تلك الصورة كبيرة (دقة عالية) وتحتاج إلى أن تكون صغيرة (دقة أقل بكثير).

لذلك أفعل الشيء الساذج (قتل كل بكسل آخر) والنتيجة تبدو سيئة.

لذلك أحاول أن أفعل شيئًا أكثر ذكاءً (تصفية مرور منخفضة باستخدام تحويل فورييه وإعادة أخذ العينات في مساحة فورييه) والنتيجة أفضل قليلاً ولكنها لا تزال سيئة إلى حد ما.

لذا سؤالي ، هل هناك خوارزمية لأسفل صورة محفوظة بشكل إدراكي (أو التنفيذ)؟

تحرير: بينما أنا على دراية بعدد من تقنيات إعادة العينات ، فإن طلبي يهتم أكثر بالحفاظ على الميزات الإدراكية ، بدلاً من إنتاج صور ناعمة.

EDIT2: من الآمن افتراض أن لدي مستوى من الألفة مع معالجة الإشارات الرقمية والتلوينات وتحويلات المويجات وما إلى ذلك

المحلول

الاستيفاء bicubic يعتبر عمومًا جيدًا بما فيه الكفاية ، ولكن لا يوجد حل مثالي ، فهذا يعتمد على الأشخاص وعلى خصائص الصورة التي يتم إعادة تشكيلها.

روابط ذات علاقة:

لم أكن أعرف حتى أنه تم استدعاء الحدة أيضًا حدوث.

اسم مستعار هي مشكلة يمكن أن تحدث عند الانخفاض بسذاجة.

نصائح أخرى

اقرا هذا:

http://www.dspguide.com/

حسنًا ، هذه قراءة تمامًا. لكن فهم تصميم المرشح سيكون مفيدًا.

بشكل عام ، فإن عملية توسيع صورة من W1 X H1 إلى W2 X H2 حيث تكون W1 و W2 و H1 و H2 من الأعداد الصحيحة ، هي العثور عوامل عدد صحيح من H3 ، ثم قم بتوصيل الصورة الأصلية باستخدام الأصفار (تستخدم لتفادي وحدات البكسل للصورة الأصلية) بحيث يكون حجمها الآن W3 x H3. يقدم هذا ترددات عالية بسبب الانقطاع في الصورة ، بحيث يمكنك تطبيق مرشح تمرير منخفض على الصورة ، ثم قم بتدوين الصورة التي تمت تصفيتها بحجمها الجديد (W2 X H2). يبدو أنك قد تحاول القيام بذلك بالفعل ، ولكن يمكن إجراء التصفية في المجال الزمني بحيث لا يكون تحويل فورييه ضروريًا حقًا.

في الممارسة العملية ، تم تحسين العملية التي وصفتها للتو (ستلاحظ أنه عند تطبيق مرشح الالتواء على الصورة الصاعدة ، ستكون معظم المصطلحات 0 ، بحيث يمكنك تجنب معظم عمليات الضرب في الخوارزمية الخاصة بك ، على سبيل المثال. نظرًا لأنك تنتهي في النهاية إلى التخلص من العديد من النتائج التي تمت تصفيتها ، فأنت لست بحاجة إلى حسابها ، لذلك ينتهي بك الأمر مع حفنة من الضربات والإضافات لكل بكسل في الصورة المستهدفة ، بشكل أساسي. الخدعة هي معرفة المعاملات ليستخدم.)

Libswscale في مشروع FFMPEG يفعل شيئًا كهذا ، على ما أعتقد. تحقق من ذلك:

http://gitorious.org/libswscale

كما أشار آخرون ، (ويبدو أنك لاحظت) تقلب الصورة يقدم القطع الأثرية المستعارة. لا يمكنني التأكد من تنفيذ إعادة تشكيلك ، لكن التقنية لها مسكات مثيرة للاهتمام اعتمادًا على حجم النافذة الذي تستخدمه وتفاصيل التنفيذ الأخرى.

باسكال على حق. يعتمد على الصورة ، وعلى ما تريد. بعض العوامل:

الحفاظ على حواف حادة
الحفاظ على الألوان
سرعة الخوارزمية

هذا هو طريقتك.

بعض الآخرين:

لاحظ أنه في بعض الأحيان يمكن أن تحصل إعادة أخذ العينات لأسفل على نتيجة أكثر وضوحًا من استخدام كاميرا أقل دقة ، لأنه ستكون هناك حواف في الصورة عالية الدقة التي لا يمكن اكتشافها بواسطة جهاز منخفض الدقة.

ملاحظة جانبية: يمكن تحسين العديد من الخوارزميات (وخاصة أقرب جار) إذا كنت تنخفض بواسطة عدد صحيح (على سبيل المثال تقسيم على 4 أو 6).

تتم مناقشة أساليب تصويري "الغرض العام الموصى بها" هنا: http://www.imagemagick.org/usage/filter/nicolas/#downsample

يمكنك تجربة خوارزمية تغيير حجم المحتوى. يرى: http://www.seamcarving.com/

طلاء أحادي (شوكة نظام التشغيل paint.net) الأدوات خوارزمية supersampling لالتقاط الصورة هنا: http://code.google.com/p/paint-mono/source/browse/trunk/src/pdnlib/surface.cs؟spec=svn59&r=59#1313

مرخصة بموجب: CC-BY-SA مع الإسناد

لا تنتمي إلى StackOverflow