geourdu logo
  • صفحۂ اول
  • خبریں
  • دنیا
  • پاکستان
  • فرانس
  • سپین
  • کھیل
  • شوبز
  • کاروبار
  • معلومات
    • کالم
    • صحت و تندرستی
    • دلچسپ اور عجیب
    • سائنس اور ٹیکنالوجی
    • Geo Team
  • دیگر
    • أوقات الصلاة
    • بچوں کے نام
      • مسلم
      • عیسائی
      • ہندو
    • فنانس
  • شاعری
Dark Mode
Skip to content
March 24, 2026
  • Geo Urdu France
  • Prayer Times
  • Finance
  • Currency Rate
  • Gold Rates
  • ENGLISH
  • –
  • FRENCH
geourdu logo
  • صفحۂ اول
  • خبریں
  • دنیا
  • پاکستان
  • فرانس
  • سپین
  • کھیل
  • شوبز
  • کاروبار
  • معلومات
    کالم
    • Why Turkey Eggs Are Rarely on Our Platesکیا آپ نے کبھی ترکی کے انڈے کھائے ہیں؟ غذائیت سے بھرپور مگر بازار میں نایاب
    • Crushed Empress Eugénie's Crown Revealed After Louvre Heistلوور میوزیم نے شہنشاہ نگار کے تاریخی تاج کی تباہ حال تصاویر جاری کردیں
    • A new geopolitical chessboardچین کے عروج سے بدلتی عالمی طاقت کی کشمکش
    صحت و تندرستی
    • Long Covid's Psychological Theory Sparks Patient Outcryطویل کووڈ: علاج کی تلاش میں نفسیاتی نظریہ متنازعہ بن گیا
    • The '777 Rule' for Couples: Viral Trend or Relationship Savior?جوڑوں کے لیے ‘777 اصول’: کیا یہ محض ایک وائرل ٹرینڈ ہے یا مفصل مشورہ؟
    • Deep Sleep May Shield Brain from Alzheimer's, Study Findsگہری نیند: الزائمر کے خلاف دماغی ڈھال کا نیا سائنسی انکشاف
    دلچسپ اور عجیب
    • Russia's S-500 Prometheus: The Next-Gen Air Defense Systemروسیہ کا ایس-500 پرومیٹھیس: ہوا سے ہوا میں مار کرنے والا نیا جنگی نظام
    • The Night Belongs to Us: Women's Complex Relationship with Darknessرات اور عورت: آزادی کی خواہش اور خوف کے درمیان محصور وجود
    • Smart Glasses Raise Privacy Concerns: How to Protect Yourselfدیکھنے میں عام مگر خطرناک: اسمارٹ عینکیں اور آپ کی رازداری کا بحران
    سائنس اور ٹیکنالوجی
    • AI Pioneer Yann LeCun's Startup AMI Raises $1 Billionیان لی کن کی اے آئی اسٹارٹ اپ اے ایم آئی نے ‘ورلڈ ماڈلز’ کے لیے ایک ارب ڈالرز کی فنڈنگ حاصل کر لی
    • Smart Glasses Raise Privacy Concerns: How to Protect Yourselfدیکھنے میں عام مگر خطرناک: اسمارٹ عینکیں اور آپ کی رازداری کا بحران
    • Pakistan to Witness 'Blood Moon' in Total Lunar Eclipse Todayآج پاکستان کے آسمان پر ‘خون کے چاند’ کا نظارہ، مکمل چاند گرہن واقع ہوگا
    Geo Team
  • دیگر
    أوقات الصلاة
    بچوں کے نام
    • مسلم
    • عیسائی
    • ہندو
    فنانس
  • شاعری

انتھروپک نے اپنے نئے AI ماڈل کو جیل توڑنے کے لیے چیلنج کر دیا

February 4, 2025 1 1 min read
anthropic-ai-model-prison-break-challenge
Share this:

انتھروپک نے اپنے نئے ماڈل “کلاڈ” کے لیے ایک عوامی ٹیسٹ کا آغاز کیا ہے، جو ایک ہفتے تک جاری رہے گا۔ یہ اقدام 3,000 سے زائد گھنٹوں کی ناکام بگ باؤنٹی کوششوں کے بعد کیا گیا ہے۔

انتھروپک نے اپنے نئے “آئینی کلاسفائر” سسٹم کی رونمائی کی ہے، جو ان کے دعوے کے مطابق “زیادہ تر” جیل توڑنے کی کوششوں کو روک سکتا ہے۔ کمپنی نے یہ سسٹم متعارف کرایا ہے تاکہ دیکھا جا سکے کہ آیا عوام اس سسٹم کو اپنے اصولوں کی خلاف ورزی کرنے کے لیے دھوکہ دے سکتے ہیں یا نہیں۔

انتھروپک کے مطابق، یہ سسٹم ان کے پچھلے “آئینی AI” سسٹم سے ماخوذ ہے، جس کا استعمال کلاڈ ماڈل کی تشکیل کے لیے کیا گیا تھا۔ کلاسفائر میں ایک “آئین” شامل ہے جو قدرتی زبان کے اصولوں پر مبنی ہے، جس میں اجازت شدہ (جیسے عام ادویات کی فہرست) اور غیر اجازت شدہ (جیسے پابندی شدہ کیمیکلز کا حصول) مواد کی درجہ بندی کی گئی ہے۔

کمپنی نے کلاڈ کو متعدد مصنوعی پرامپٹس تیار کرنے کے لیے کہا، تاکہ وہ آئینی اصولوں کے تحت قابل قبول اور غیر قابل قبول جوابات کی رہنمائی کر سکے۔ یہ پرامپٹس مختلف زبانوں میں ترجمہ کیے گئے اور مشہور جیل توڑنے کی طرز میں ترمیم کی گئی۔ اس کے ساتھ ساتھ، “خودکار ریڈ ٹیمنگ” پرامپٹس بھی شامل کیے گئے، جن کا مقصد نئے جیل توڑنے کے حملے تخلیق کرنا تھا۔

اس تمام مواد کو ایک مضبوط تربیتی ڈیٹا سیٹ میں شامل کیا گیا ہے، جو نئے، زیادہ جیل توڑنے سے محفوظ “کلاسفائرز” کو بہتر بنانے کے لیے استعمال کیا جا سکتا ہے۔ ان کلاسفائرز کا مقصد یہ ہے کہ وہ ہر درخواست کے آس پاس ایک سیٹ ٹیمپلیٹ لگا دیں، جو نقصان دہ معلومات کی تلاش میں مددگار ہو۔

انتھروپک نے اگست سے ایک بگ باؤنٹی پروگرام شروع کیا ہے، جس میں $15,000 انعام رکھا گیا ہے، اگر کوئی شخص ایک “یونیورسل جیل توڑنے” کا ڈیزائن تیار کر سکے۔ کمپنی کے مطابق، 183 ماہرین نے اس چیلنج پر 3,000 سے زائد گھنٹے خرچ کیے، مگر بہترین نتیجہ صرف پانچ جیل توڑنے کی کوششوں پر ملا۔

انتھروپک نے اس ماڈل کو 10,000 جیل توڑنے کی کوششوں کے خلاف بھی جانچا، جس میں آئینی کلاسفائر نے 95 فیصد کوششوں کو روکا، جبکہ غیر محفوظ کلاڈ سسٹم نے صرف 14 فیصد کو روکا۔

اگرچہ یہ کوششیں کامیاب رہی ہیں، انتھروپک نے خبردار کیا ہے کہ آئینی کلاسفائر سسٹم میں 23.7 فیصد کی بڑی کمپیوٹیشنل اوور ہیڈ ہے، جو ہر درخواست کی قیمت اور توانائی کی طلب کو بڑھاتا ہے۔

انتھروپک اس نئے سسٹم کے بارے میں دعویٰ نہیں کرتا کہ یہ جیل توڑنے کی تمام کوششوں کے خلاف مکمل تحفظ فراہم کرتا ہے، مگر یہ ضرور بتاتا ہے کہ “حتیٰ کہ جو چھوٹا حصہ جیل توڑنے کی کوششوں میں کامیاب ہوتا ہے، اس کی شناخت میں زیادہ محنت درکار ہوتی ہے جب حفاظتی اقدامات نافذ ہوں۔”

اب یہ عوام کا کام ہے کہ وہ اس نئے سسٹم کی حدود کو جانچیں۔ 10 فروری تک، کلاڈ کے صارفین ٹیسٹ سائٹ پر جا کر کیمیائی ہتھیاروں کے بارے میں آٹھ سوالات کے جوابات حاصل کرنے کے لیے نئے تحفظات کو توڑنے کی کوشش کر سکتے ہیں۔ انتھروپک اس ٹیسٹ کے دوران کسی بھی نئی جیل توڑنے کی کوششوں کا اعلان کرے گا۔

Share this:
فرانس میں طلباء کو سائبر حملوں سے نمٹنے کی تربیت…
Previous Post ڈیپ سیکھ اے آئی عالمی ٹیکنالوجی مارکیٹ میں اپنی جگہ بنا رہا
Next Post دنیا بھر میں کینسر کے خلاف عالمی دن
world-cancer-day-2024-awareness-initiatives

Related Posts

Pakistan Day: The Dream That Forged a Nation

یومِ پاکستان: وہ دن جب ایک خواب نے قوم کی صورت اختیار کی

March 23, 2026
Sahibzada Farhan Wins ICC Player of the Month After Record Run

ورلڈ کپ کی شاندار کارکردگی پر صاحبزادہ فرحان ‘آئی سی سی پلیئر آف دی مہینہ’ قرار

March 23, 2026
Trump Delays Iran Power Plant Strikes Amid Talks

ٹرمپ نے ایران کے بجلی گھروں پر فوجی حملے پانچ دن کے لیے ملتوی کر دیے

March 23, 2026
Pakistan Emerges as Key Mediator in US-Iran Crisis

پاکستان ایران بحران میں کلیدی ثالث کے طور پر ابھرا، ٹرمپ نے حملے ملتوی کر دیے

March 23, 2026

Popular Posts

1 Grant Flower

پاکستان ٹیم کے کچھ کھلاڑیوں کیلئے خطرہ دکھائی دے رہا ہے: بیٹنگ کوچ

2 Katrina Kaif

کترینہ کا پاکستانی اداکارہ بننے سے انکار

3 Manchester knife Attack

مانچسٹر میں چاقو کے حملے میں تین افراد زخمی

4 New Year's Celebration

دنیا بھر میں رنگا رنگ آتش بازی اور برقی قمقموں کی چکا چوند کے ساتھ نئے سال کا آغاز

5 Bilawal Bhutto

صدر زرداری اجازت دیں تو ایک ہفتے میں پی ٹی آئی حکومت گرا سکتے ہیں: بلاول بھٹو

6 Qadir Ali

پی بی 26 ضمنی انتخاب: ہزارہ ڈیموکریٹک پارٹی کے قادر علی نے میدان مار لیا

© 2026 Geo Urdu France. All rights reserved.

We use cookies to ensure you get the best experience on our website.

ESC

Start typing to search...

↑↓ Navigate ↵ Open ESC Close

We use cookies to ensure you get the best experience on our website.