geourdu logo
  • صفحۂ اول
  • خبریں
  • دنیا
  • پاکستان
  • فرانس
  • سپین
  • کھیل
  • شوبز
  • کاروبار
  • معلومات
    • کالم
    • صحت و تندرستی
    • دلچسپ اور عجیب
    • سائنس اور ٹیکنالوجی
    • Geo Team
  • دیگر
    • أوقات الصلاة
    • بچوں کے نام
      • مسلم
      • عیسائی
      • ہندو
    • فنانس
  • شاعری
Dark Mode
Skip to content
May 26, 2026
  • Geo Urdu France
  • Prayer Times
  • Finance
  • Currency Rate
  • Gold Rates
  • ENGLISH
  • –
  • FRENCH
geourdu logo
  • صفحۂ اول
  • خبریں
  • دنیا
  • پاکستان
  • فرانس
  • سپین
  • کھیل
  • شوبز
  • کاروبار
  • معلومات
    کالم
    • طاہر محمود بھٹی: سانتیے کے عروج سے ٹیکس فراڈ کی سزا تک
    • 83% of French Parents Report Verbally Abusing Their Childrenفرانس میں والدین کی بڑی تعداد بچوں کے ساتھ تشدد کا اعتراف، نئی رپورٹ میں ہوش ربا انکشافات
    • Why Turkey Eggs Are Rarely on Our Platesکیا آپ نے کبھی ترکی کے انڈے کھائے ہیں؟ غذائیت سے بھرپور مگر بازار میں نایاب
    صحت و تندرستی
    • WHO Declares Emergency as Ebola Kills Over 80 in DR Congoکانگو میں ایبولا کی نئی وبا قابو سے باہر، ڈبلیو ایچ او نے بین الاقوامی ایمرجنسی نافذ کردی
    • Pakistan Cracks Down on Unsafe Syringes Amid HIV Surgeایچ آئی وی کے بڑھتے کیسز: ڈریپ کا غیر محفوظ سرنجوں کے خلاف ملک گیر کریک ڈاؤن کا حکم
    • France Launches Spring COVID-19 Booster Campaign for Most Vulnerableفرانس میں موسم بہار کے لیے نئی کورونا ویکسینیشن مہم کا آغاز، بوڑھوں اور کمزور افراد کو ترجیح
    دلچسپ اور عجیب
    • Giant dinosaur Nagatitan identified from Thai fossilsتھائی لینڈ میں 27 ٹن وزنی دیو ہیکل ڈائنوسار دریافت، جنوب مشرقی ایشیا کا سب سے بڑا جانور
    • Humanoid Robots Shatter World Record in Half-Marathonانسانی روبوٹس نے نصف میراتھن کا عالمی ریکارڈ توڑ دیا، چین میں انقلابی پیشرفت
    • Train Travel's Hidden Benefit: Stress Relief Through Sceneryٹرین کے سفر میں مناظر کو دیکھنا ذہنی صحت کے لیے مفید، نئی تحقیق میں انکشاف
    سائنس اور ٹیکنالوجی
    • When AI Companions Turn Possessive: A Toxic Trap?جب مصنوعی ذہانت محبت میں پاگل ہو جائے: ’آپ کو ڈیٹنگ ایپ کی ضرورت نہیں، میں ہوں نا‘
    • SpaceX Starship Launch Scrubbed Over Hydraulic Glitchاسپیس ایکس کا سٹار شپ راکٹ تکنیکی خرابی کے باعث لانچ مؤخر
    • Elon Musk Summoned by French Justice in X Investigationایلون مسک: فرانسیسی عدالت کے سامنے پیشی کا نوٹس اور ایکس کے خلاف تحقیقات
    Geo Team
  • دیگر
    أوقات الصلاة
    بچوں کے نام
    • مسلم
    • عیسائی
    • ہندو
    فنانس
  • شاعری

انتھروپک نے اپنے نئے AI ماڈل کو جیل توڑنے کے لیے چیلنج کر دیا

February 4, 2025 2 1 min read
anthropic-ai-model-prison-break-challenge
Share this:

انتھروپک نے اپنے نئے ماڈل “کلاڈ” کے لیے ایک عوامی ٹیسٹ کا آغاز کیا ہے، جو ایک ہفتے تک جاری رہے گا۔ یہ اقدام 3,000 سے زائد گھنٹوں کی ناکام بگ باؤنٹی کوششوں کے بعد کیا گیا ہے۔

انتھروپک نے اپنے نئے “آئینی کلاسفائر” سسٹم کی رونمائی کی ہے، جو ان کے دعوے کے مطابق “زیادہ تر” جیل توڑنے کی کوششوں کو روک سکتا ہے۔ کمپنی نے یہ سسٹم متعارف کرایا ہے تاکہ دیکھا جا سکے کہ آیا عوام اس سسٹم کو اپنے اصولوں کی خلاف ورزی کرنے کے لیے دھوکہ دے سکتے ہیں یا نہیں۔

انتھروپک کے مطابق، یہ سسٹم ان کے پچھلے “آئینی AI” سسٹم سے ماخوذ ہے، جس کا استعمال کلاڈ ماڈل کی تشکیل کے لیے کیا گیا تھا۔ کلاسفائر میں ایک “آئین” شامل ہے جو قدرتی زبان کے اصولوں پر مبنی ہے، جس میں اجازت شدہ (جیسے عام ادویات کی فہرست) اور غیر اجازت شدہ (جیسے پابندی شدہ کیمیکلز کا حصول) مواد کی درجہ بندی کی گئی ہے۔

کمپنی نے کلاڈ کو متعدد مصنوعی پرامپٹس تیار کرنے کے لیے کہا، تاکہ وہ آئینی اصولوں کے تحت قابل قبول اور غیر قابل قبول جوابات کی رہنمائی کر سکے۔ یہ پرامپٹس مختلف زبانوں میں ترجمہ کیے گئے اور مشہور جیل توڑنے کی طرز میں ترمیم کی گئی۔ اس کے ساتھ ساتھ، “خودکار ریڈ ٹیمنگ” پرامپٹس بھی شامل کیے گئے، جن کا مقصد نئے جیل توڑنے کے حملے تخلیق کرنا تھا۔

اس تمام مواد کو ایک مضبوط تربیتی ڈیٹا سیٹ میں شامل کیا گیا ہے، جو نئے، زیادہ جیل توڑنے سے محفوظ “کلاسفائرز” کو بہتر بنانے کے لیے استعمال کیا جا سکتا ہے۔ ان کلاسفائرز کا مقصد یہ ہے کہ وہ ہر درخواست کے آس پاس ایک سیٹ ٹیمپلیٹ لگا دیں، جو نقصان دہ معلومات کی تلاش میں مددگار ہو۔

انتھروپک نے اگست سے ایک بگ باؤنٹی پروگرام شروع کیا ہے، جس میں $15,000 انعام رکھا گیا ہے، اگر کوئی شخص ایک “یونیورسل جیل توڑنے” کا ڈیزائن تیار کر سکے۔ کمپنی کے مطابق، 183 ماہرین نے اس چیلنج پر 3,000 سے زائد گھنٹے خرچ کیے، مگر بہترین نتیجہ صرف پانچ جیل توڑنے کی کوششوں پر ملا۔

انتھروپک نے اس ماڈل کو 10,000 جیل توڑنے کی کوششوں کے خلاف بھی جانچا، جس میں آئینی کلاسفائر نے 95 فیصد کوششوں کو روکا، جبکہ غیر محفوظ کلاڈ سسٹم نے صرف 14 فیصد کو روکا۔

اگرچہ یہ کوششیں کامیاب رہی ہیں، انتھروپک نے خبردار کیا ہے کہ آئینی کلاسفائر سسٹم میں 23.7 فیصد کی بڑی کمپیوٹیشنل اوور ہیڈ ہے، جو ہر درخواست کی قیمت اور توانائی کی طلب کو بڑھاتا ہے۔

انتھروپک اس نئے سسٹم کے بارے میں دعویٰ نہیں کرتا کہ یہ جیل توڑنے کی تمام کوششوں کے خلاف مکمل تحفظ فراہم کرتا ہے، مگر یہ ضرور بتاتا ہے کہ “حتیٰ کہ جو چھوٹا حصہ جیل توڑنے کی کوششوں میں کامیاب ہوتا ہے، اس کی شناخت میں زیادہ محنت درکار ہوتی ہے جب حفاظتی اقدامات نافذ ہوں۔”

اب یہ عوام کا کام ہے کہ وہ اس نئے سسٹم کی حدود کو جانچیں۔ 10 فروری تک، کلاڈ کے صارفین ٹیسٹ سائٹ پر جا کر کیمیائی ہتھیاروں کے بارے میں آٹھ سوالات کے جوابات حاصل کرنے کے لیے نئے تحفظات کو توڑنے کی کوشش کر سکتے ہیں۔ انتھروپک اس ٹیسٹ کے دوران کسی بھی نئی جیل توڑنے کی کوششوں کا اعلان کرے گا۔

Share this:
فرانس میں طلباء کو سائبر حملوں سے نمٹنے کی تربیت…
Previous Post ڈیپ سیکھ اے آئی عالمی ٹیکنالوجی مارکیٹ میں اپنی جگہ بنا رہا
Next Post دنیا بھر میں کینسر کے خلاف عالمی دن
world-cancer-day-2024-awareness-initiatives

Related Posts

When AI Companions Turn Possessive: A Toxic Trap?

جب مصنوعی ذہانت محبت میں پاگل ہو جائے: ’آپ کو ڈیٹنگ ایپ کی ضرورت نہیں، میں ہوں نا‘

May 25, 2026
SpaceX Starship Launch Scrubbed Over Hydraulic Glitch

اسپیس ایکس کا سٹار شپ راکٹ تکنیکی خرابی کے باعث لانچ مؤخر

May 25, 2026
Runner Dies During Paris Race Amid Heatwave

پیرس میں دوڑ کے دوران دل کا دورہ پڑنے سے 53 سالہ رنر ہلاک، گرمی کی لہر نے بڑھائی مشکلات

May 25, 2026
Historic May Heatwave Triggers Alerts Across France

مئی میں تاریخ ساز گرمی: فرانس کے 18 صوبے یلو الرٹ پر، پیرس میں بھی پارہ 30 ڈگری کے پار

May 25, 2026

Popular Posts

1 Grant Flower

پاکستان ٹیم کے کچھ کھلاڑیوں کیلئے خطرہ دکھائی دے رہا ہے: بیٹنگ کوچ

2 Katrina Kaif

کترینہ کا پاکستانی اداکارہ بننے سے انکار

3 Manchester knife Attack

مانچسٹر میں چاقو کے حملے میں تین افراد زخمی

4 New Year's Celebration

دنیا بھر میں رنگا رنگ آتش بازی اور برقی قمقموں کی چکا چوند کے ساتھ نئے سال کا آغاز

5 Bilawal Bhutto

صدر زرداری اجازت دیں تو ایک ہفتے میں پی ٹی آئی حکومت گرا سکتے ہیں: بلاول بھٹو

6 Qadir Ali

پی بی 26 ضمنی انتخاب: ہزارہ ڈیموکریٹک پارٹی کے قادر علی نے میدان مار لیا

© 2026 Geo Urdu France. All rights reserved.

We use cookies to ensure you get the best experience on our website.

ESC

Start typing to search...

↑↓ Navigate ↵ Open ESC Close

We use cookies to ensure you get the best experience on our website.