تحليل الانحدار واستراتيجيات التداول الكمي


تحليل الانحدار المتعدد. استراتيجية مولد واختبار في واحد.
المقدمة.
معرفة مني عند حضور دورة تداول العملات الأجنبية، تلقت مرة واحدة مهمة لتطوير نظام التداول. بعد أن واجهت مشكلة معه لمدة أسبوع تقريبا، قال إن هذه المهمة ربما كانت أكثر صعوبة من كتابة أطروحة. ثم اقترحت استخدام تحليل الانحدار المتعدد. ونتيجة لذلك، تمت الموافقة بنجاح على نظام تداول تم تطويره من نقطة الصفر بين عشية وضحاها من قبل الفاحص.
نجاح استخدام الانحدار المتعدد هو في القدرة على العثور بسرعة على العلاقات بين المؤشرات والسعر. وتتيح العلاقات المكتشفة التنبؤ بقيمة السعر استنادا إلى قيم المؤشرات بدرجة معينة من الاحتمالات. تسمح البرمجيات الإحصائية الحديثة لتصفية الآلاف من المعلمات في وقت واحد في محاولة للعثور على هذه العلاقات. ويمكن مقارنة هذا مع الذهب غربلة الصناعية من الحصى.
وسيتم تطوير استراتيجية جاهزة للاستخدام وكذلك مولد استراتيجية عن طريق تحميل بيانات المؤشر في تحليل الانحدار المتعدد وتطبيق التلاعب البيانات، على التوالي.
سوف توضح هذه المقالة عملية إنشاء استراتيجية التداول باستخدام تحليل الانحدار المتعدد.
1. تطوير روبأوترادر ​​- قطعة من كعكة!
كان العمود الفقري لنظام التداول الذي تم تطويره بين عشية وضحاها كما ذكر سابقا معادلة واحدة:
حيث إذا ريج & غ؛ 0، ثم نشتري، وإذا ريج & لوت؛ 0، نبيع.
وكانت المعادلة نتيجة لتحليل الانحدار المتعدد الذي استخدم عينة البيانات من المؤشرات القياسية. تم تطوير إي على أساس المعادلة. قطعة التعليمات البرمجية المسؤولة عن قرارات التداول تتألف تقريبا من 15 سطرا فقط. يتم إرفاق إي مع شفرة مصدر كاملة (R_check).
تم جمع عينة البيانات لتحليل الانحدار على اليورو مقابل الدولار الأميركي H1 على مدى شهرين من 1 يوليو 2018 إلى 31 أغسطس 2018.
ويبين الشكل 1 نتائج أداء منطقة العد خلال فترة البيانات التي تم تطويرها. ومن الغريب أن الربحية الفائقة، والتي غالبا ما تكون الحالة في المختبر، لم يلاحظ على بيانات التدريب. ويجب أن تكون علامة على عدم إعادة تفعيلها.
الشكل 1. أداء إي خلال فترة التدريب.
ويبين الشكل 2 نتائج أداء منطقة العد على بيانات الاختبار (من 1 سبتمبر إلى 1 نوفمبر 2018). ويبدو أن بيانات الشهرين كانت كافية لكي تبقى منطقة العد مربحة لشهرين آخرين. ومع ذلك، فإن الربح الذي حققته إي خلال فترة الاختبار كان هو نفسه على مدى فترة التدريب.
الشكل 2. أداء إي خلال فترة الاختبار.
وهكذا، واستنادا إلى تحليل الانحدار المتعدد وضعت إي بسيط إلى حد ما أرباحا تربو خارج بيانات التدريب. وبالتالي يمكن تطبيق تحليل الانحدار بنجاح عند بناء أنظمة التداول.
ومع ذلك، ينبغي عدم المبالغة في تقدير موارد تحليل الانحدار. وستعرض مزاياه وعيوبه أدناه.
2. تحليل الانحدار المتعدد.
والغرض العام من الانحدار المتعدد هو تحليل العلاقة بين عدة متغيرات مستقلة ومتغير تابع واحد. في حالتنا، هو تحليل العلاقة بين قيم المؤشرات وحركة السعر.
في أبسط أشكالها، قد تظهر هذه المعادلة على النحو التالي:
تغير السعر = a * رسي + b * ماسد + с.
ولا يمكن توليد معادلة الانحدار إلا إذا كان هناك ارتباط بين المتغيرات المستقلة والمتغير التابع. ولما كانت قيم المؤشرات مترابطة كقاعدة عامة، فإن المساهمة التي تقدمها المؤشرات للتنبؤ قد تختلف كثيرا إذا ما أضيف مؤشر أو أزيل من التحليل. يرجى ملاحظة أن معادلة الانحدار هو مجرد دليل على الاعتماد العددي وليس وصفا للعلاقات السببية. وتشير المعاملات (أ، ب) إلى مساهمة كل متغير مستقل في علاقته مع متغير تابع.
معادلة الانحدار تمثل الاعتماد المثالي بين المتغيرات. ولكن هذا مستحيل في الفوركس والتنبؤ سوف تختلف دائما عن الواقع. الفرق بين القيمة المتوقعة والمتوقعة يسمى بقايا. ويسمح تحليل المخلفات بتحديد جملة أمور منها التبعية اللاخطية بين المؤشر والسعر. في حالتنا، نفترض أن هناك فقط الاعتماد غير الخطية بين المؤشرات والسعر. ولحسن الحظ، فإن تحليل الانحدار لا يتأثر بالانحرافات الطفيفة عن الخطية.
لا يمكن إلا أن تستخدم لتحليل المعلمات الكمية. المعلمات النوعية التي ليس لها قيم انتقالية ليست مناسبة للتحليل.
حقيقة أن تحليل الانحدار يمكن معالجة أي عدد من المعلمات قد يؤدي إلى إغراء لتشمل في تحليل أكبر عدد ممكن منها. ولكن إذا كان عدد المعلمات المستقلة أكبر من عدد الملاحظات من تفاعلها مع المعلمة التابعة، هناك فرصة كبيرة للحصول على المعادلات المنتجة توقعات جيدة والتي تستند على أساس التقلبات العشوائية.
ويكون عدد المشاهدات أكبر من 10-20 مرة من عدد المعلمات المستقلة.
في حالتنا، يكون عدد المؤشرات الواردة في عينة البيانات أكبر من 10-20 مرة من عدد الصفقات في عينتنا. وعندئذ تعتبر المعادلة المتولدة موثوقة. العينة التي استندت إليها روبأوتريدر كما هو موضح في القسم 1 تم تطويره، و يحتوي على 33 معلما و 836 ملاحظة. ونتيجة لذلك، كان عدد المعلمات 25 مرة أكبر من عدد من الملاحظات. وهذا الشرط قاعدة عامة في الإحصاءات. وهي تنطبق أيضا على محسن اختبار استراتيجية ميتاتريدر 5.
وعلاوة على ذلك، كل قيمة معينة من المؤشر في محسن هو في الواقع معلمة منفصلة. وبعبارة أخرى، عند اختبار 10 قيم مؤشر، ونحن نتعامل مع 10 معلمات مستقلة التي يجب أن تؤخذ بعين الاعتبار من أجل تجنب إعادة التشغيل. يجب أن يتضمن تقرير المحسن معلمة أخرى: متوسط ​​عدد الصفقات / عدد القيم لجميع المعلمات المحسنة. إذا كانت قيمة المؤشر أقل من عشرة، فمن المحتمل أن تكون هناك حاجة لإعادة التشغيل.
وثمة شيء آخر ينبغي النظر فيه هو القيم المتطرفة. أحداث نادرة لكنها قوية (في حالة ارتفاع الأسعار) قد تضيف تبعيات كاذبة إلى المعادلة. على سبيل المثال، بعد الأخبار غير المتوقعة، استجاب السوق مع تحركات كبيرة استمرت لبضع ساعات. إن قيم المؤشرات الفنية لن تكون في هذه الحالة ذات أهمية تذكر في التوقعات بعد، لكنها ستعتبر ذات أهمية كبيرة في تحليل الانحدار حيث كان هناك تغير ملحوظ في الأسعار. ولذلك فمن المستحسن لتصفية بيانات العينة أو التحقق من ذلك عن القيم المتطرفة المحتملة.
3. إنشاء الاستراتيجية الخاصة بك.
لقد اقتربنا من الجزء الرئيسي حيث سنرى كيفية إنشاء معادلة الانحدار استنادا إلى البيانات الخاصة بك. إن تطبيق تحليل الانحدار يشبه تحليل التحليل التمييزي المبين سابقا. يتضمن تحليل الانحدار ما يلي:
إعداد البيانات للتحليل. اختيار أفضل المتغيرات من البيانات المعدة. الحصول على معادلة الانحدار.
تحليل الانحدار المتعدد هو جزء من العديد من منتجات البرمجيات المتقدمة المخصصة لتحليل البيانات الإحصائية. الأكثر شعبية هي ستاتيستيكا (بواسطة ستاتسوفت وشركة) و سبس (من قبل شركة عب). وسوف ننظر كذلك في تطبيق تحليل الانحدار باستخدام ستاتيستيكا 8.0.
3.1. إعداد بيانات التحليل.
نحن لتوليد معادلة الانحدار حيث يمكن التنبؤ سلوك السعر على شريط التالي استنادا إلى قيم مؤشر على شريط الحالي.
وسوف تستخدم نفس منطقة العد التي استخدمت لإعداد بيانات التحليل التمييزي لجمع البيانات. سوف نقوم بتوسيع وظائفها عن طريق إضافة وظيفة لحفظ قيم المؤشر مع فترات أخرى. وستستخدم مجموعة موسعة من البارامترات لتحسين الاستراتيجية استنادا إلى تحليل المؤشرات نفسها ولكن بفترات مختلفة.
لتحميل البيانات في ستاتيستيكا، يجب أن يكون لديك ملف كسف مع بنية التالية. يتم ترتيب المتغيرات في أعمدة حيث يتوافق كل عمود مع مؤشر معين. يجب أن تحتوي الصفوف على قياسات متتالية (حالات)، أي قيم مؤشرات بعض الحانات. وبعبارة أخرى، تحتوي رؤوس الجداول الأفقية على مؤشرات، وتحتوي رؤوس الجداول العمودية على أشرطة متتالية.
المؤشرات التي سيتم تحليلها هي:
يحتوي كل صف بيانات من ملفنا على:
التغييرات في السعر على شريط بين فتح وإغلاق. قيم المؤشرات التي لوحظت في الشريط السابق.
وبالتالي، فإننا سوف تولد معادلة تصف سلوك الأسعار في المستقبل على أساس القيم مؤشر معروف.
وبصرف النظر عن قيمة المؤشر المطلق، نحن بحاجة إلى حفظ الفرق بين القيم المطلقة والقيم السابقة من أجل رؤية اتجاه التغيير في المؤشرات. أسماء هذه المتغيرات في المثال المقدم سيكون لها البادئة 'د'. وبالنسبة لمؤشرات خط الإشارة، من الضروري حفظ الفرق بين الخط الرئيسي والإشارة وكذلك دينامياته. أسماء البيانات التي تم جمعها بواسطة مؤشرات مع فترات أخرى تنتهي ب 'p'.
ومن أجل إظهار التحسين، أضيفت فترة واحدة فقط، وهي ضعف طول الفترة القياسية للمؤشر. وبالإضافة إلى ذلك، وتوفير الوقت من شريط جديد وقيمة ساعة ذات الصلة. حفظ الفرق بين فتح وإغلاق للشريط حيث يتم احتساب المؤشرات. وسيلزم ذلك لتصفية القيم المتطرفة. ونتيجة لذلك، سيتم تحليل 33 معلما لتوليد معادلة انحدار متعددة. يتم تنفيذ جمع البيانات أعلاه في إي R_collection المرفقة بهذه المادة.
سيتم إنشاء الملف MasterData. CSV بعد بدء إي في terminal_data_directory / MQL5 / الملفات. عند بدء إي في المختبر، وسوف يكون موجودا في terminal_data_directory / تستر / إدجنت-127.0.0.1-3000 / MQL5 / الملفات. الملف كما تم الحصول عليها يمكن استخدامها في ستاتيستيكا.
مثال على هذا الملف يمكن العثور عليها في MasterDataR. CSV. تم جمع البيانات عن اليورو مقابل الدولار الأميركي H1 من 3 يناير 2018 إلى 11 نوفمبر 2018 باستخدام اختبار الاستراتيجية. تم استخدام بيانات أغسطس وسبتمبر فقط في التحليل. تم حفظ البيانات المتبقية في ملف لتتمكن من ممارسة.
من أجل فتح ملف. كسف في ستاتيستيكا، القيام على النحو التالي.
في ستاتيستيكا، انتقل إلى القائمة ملف & غ؛ افتح، حدد نوع الملف 'داتا فيليز' وافتح ملفك. CSV. اترك محددا في نافذة نوع ملف استيراد النص وانقر فوق موافق. تمكين العناصر التي تحتها خط في النافذة المفتوحة. ضع في اعتبارك وضع النقطة العشرية في حقل حرف فاصل عشري بغض النظر عما إذا كان هناك بالفعل أم لا.
الشكل 3. استيراد الملف إلى ستاتيستيكا.
انقر فوق موافق للحصول على الجدول الذي يحتوي على بياناتنا التي هي على استعداد لتحليل الانحدار المتعدد. مثال على الملف الذي تم الحصول عليه لاستخدام ستاتيستيكا يمكن العثور عليها في MasterDataR. STA.
3.2. التحديد التلقائي للمؤشرات.
تشغيل تحليل الانحدار (الاحصائيات - & غ؛ الانحدار المتعدد).
الشكل 4. تشغيل تحليل الانحدار.
في النافذة المفتوحة، انتقل إلى علامة التبويب خيارات متقدمة وتمكين العناصر المحددة. انقر على الزر المتغيرات.
حدد المتغير التابع في الحقل الأول والمتغيرات المستقلة التي تقوم على أساسها المعادلة - في الحقل الثاني. في حالتنا، حدد المعلمة السعر في الحقل الأول والسعر 2 إلى دوبر - في الحقل الثاني.
الشكل 5. التحضير لاختيار المعلمات.
انقر فوق الزر تحديد الحالات (الشكل 5).
سيتم فتح نافذة لاختيار الحالات (صفوف البيانات) التي سيتم استخدامها في التحليل. تمكين العناصر كما هو مبين في الشكل 6.
الشكل 6. اختيار الحالات.
تحديد البيانات المتعلقة يوليو وأغسطس التي سيتم استخدامها في التحليل. هذه هي الحالات من 3590 إلى 4664. يتم تعيين عدد الحالات عبر المتغير V0. من أجل تجنب تأثير القيم المتطرفة وارتفاع الأسعار، إضافة تصفية البيانات حسب السعر.
تضمين في التحليل فقط قيم المؤشرات التي لا يزيد الفرق بين فتح و إغلاق على الشريط الأخير أكثر من 250 نقطة. من خلال تحديد هنا قواعد لاختيار الحالات للتحليل، قمنا بتعيين عينة بيانات لتوليد المعادلة الانحدار. انقر فوق موافق هنا وفي إطار للتحضير لاختيار المعلمات (الشكل 5).
سيتم فتح نافذة مع خيارات من أساليب اختيار البيانات التلقائي. حدد طريقة الأمام إلى الأمام (الشكل 7).
الشكل 7. اختيار الطريقة.
انقر فوق موافق. وستفتح نافذة تخبرك بأن تحليل الانحدار قد اكتمل بنجاح.
الشكل 8. نافذة نتائج تحليل الانحدار.
التحديد التلقائي للمعلمات يتعلق فقط تلك التي تساهم ماديا في الارتباط المتعدد بين المعلمات (المتغيرات المستقلة) والمتغير التابع. في حالتنا، سيتم اختيار مجموعة من المؤشرات، وأفضل الأسعار تحديد. في الواقع، يعمل الاختيار التلقائي كمولد للاستراتيجية. سوف تتكون المعادلة الناتجة فقط من المؤشرات التي يمكن الاعتماد عليها وأفضل وصف سلوك السعر.
ويحتوي الجزء العلوي من نافذة النتائج (الشكل 8) على خصائص إحصائية للمعادلة المولدة بينما ترد المعلمات المدرجة في المعادلة في الأسفل. يرجى الانتباه إلى الخصائص تحت خط. متعددة R هي قيمة الارتباط المتعدد بين السعر والمؤشرات المدرجة في المعادلة. "p" هو مستوى الدلالة الإحصائية لهذا الارتباط.
ويعتبر مستوى أقل من 0.05 ذو دلالة إحصائية. "عدد الحالات" هو عدد الحالات المستخدمة في التحليل. يتم عرض المؤشرات التي مساهمة ذات دلالة إحصائية باللون الأحمر. من الناحية المثالية، يجب وضع علامة على جميع المؤشرات باللون الأحمر.
القواعد المستخدمة في الإحصاء لإدراج المعلمات في التحليل ليست دائما الأمثل. على سبيل المثال، قد يتم تضمين عدد كبير من المعلمات غير الهامة في معادلة الانحدار. ولذلك يجب علينا استخدام إبداعنا ومساعدة البرنامج في اختيار المعلمات.
إذا كانت القائمة تحتوي على معلمات غير هامة، انقر فوق ملخص: نتائج الانحدار.
سيتم فتح نافذة عرض البيانات على كل مؤشر (الشكل 9).
الشكل 9. تقرير عن المعلمات المدرجة في معادلة الانحدار.
العثور على معلمة غير هامة مع أعلى مستوى p وتذكر اسمها. العودة إلى الخطوة حيث تم تضمين المعلمات في التحليل (الشكل 7) وإزالة هذه المعلمة من قائمة المعلمات المحددة للتحليل.
للعودة، انقر فوق إلغاء في نافذة نتائج التحليل وكرر التحليل. حاول استبعاد جميع المعلمات غير المهمة بهذه الطريقة. عند القيام بذلك، ابحث عن قيمة الارتباط متعددة الحصول عليها (متعددة R) لأنه لا ينبغي أن يكون أقل بكثير من القيمة الأولية. يمكن إزالة المعلمات غير الهامة من التحليل واحدا تلو الآخر أو كل في وقت واحد، والخيار الأول هو أكثر من المستحسن.
ونتيجة لذلك، يتضمن الجدول الآن المعلمات الهامة فقط (الشكل 10). وانخفضت قيمة الارتباط بنسبة 20٪ والتي ربما يرجع ذلك إلى الصدامات العشوائية. ومن المعروف أن سلسلة العددية طويلة بلا حدود لديها عدد لا حصر له من الصدامات العشوائية.
وبما أن عينات البيانات التي نقوم بمعالجتها كبيرة جدا، فإن الصدامات العشوائية والعلاقات العشوائية غالبا ما تكون هي الحالة. ولذلك فمن المهم استخدام المعلمات ذات دلالة إحصائية في الاستراتيجيات الخاصة بك.
الشكل 10. وتشمل المعادلة المعلمات الهامة فقط.
إذا بعد اختيار المعلمات، لا يمكن تشكيل مجموعة من عدة مؤشرات ترتبط بشكل كبير مع السعر، ومن المرجح أن تحتوي على معلومات قليلة عن الأحداث الماضية. يجب أن تكون الصفقات القائمة على أي تحليل تقني في مثل هذه الحالات حكيمة جدا أو حتى معلقة تماما.
وفي حالتنا، أثبتت خمسة فقط من أصل 33 معلما أن تكون فعالة في وضع استراتيجية على أساس معادلة الانحدار. هذه النوعية من تحليل الانحدار هي ذات فائدة كبيرة عند اختيار مؤشرات لاستراتيجيات الخاصة بك.
3.3. معادلة الانحدار وتحليلها.
لذلك قمنا بتشغيل تحليل الانحدار وحصلنا على قائمة المؤشرات "الصحيحة". دعونا الآن تحويل كل ذلك إلى معادلة الانحدار. وترد معاملات المعادلة لكل مؤشر في العمود باء لنتائج تحليل الانحدار (الشكل 10). المعامل إنتيرسيبت في نفس الجدول هو عضو مستقل في المعادلة ويتم تضمينه فيه كمعامل مستقل.
دعونا نولد معادلة على أساس الجدول (الشكل 10)، مع الأخذ معاملات من العمود باء.
السعر = 22.7 + 205.2 * دديماركر - 41686.2 * داك - 139.3 * ديماركر + 22468.8 * الثيران - 14619.5 * الدببة.
وهذه المعادلة موضحة سابقا في القسم 1 كقاعدة MQL5 جنبا إلى جنب مع نتائج الأداء التي تم الحصول عليها من المختبر في منطقة العد التي تم تطويرها على أساس هذه المعادلة. كما يمكن أن يرى، كان تحليل الانحدار كافية عند استخدامها كمختبر استراتيجية. وأدى التحليل إلى وضع استراتيجية معينة واختيار مؤشرات ذات صلة من القائمة المقترحة.
في حال كنت ترغب في مزيد من تحليل استقرار المعادلة، يجب عليك التحقق من:
القيم المتطرفة في المعادلة. • طبيعة توزيع البقايا؛ تأثير غير الخطية التي تنتجها المعلمات الفردية داخل المعادلة.
ويمكن إجراء هذه الشيكات باستخدام التحليل المتبقي. للمضي قدما في التحليل، انقر فوق موافق في نافذة النتائج (الشكل 8). بعد تنفيذ الشيكات المذكورة أعلاه فيما يتعلق بالمعادلة ولدت، سترى أن المعادلة لا يبدو أن تكون حساسة لعدد قليل من القيم المتطرفة، والانحراف صغير من التوزيع الطبيعي للبيانات وعدم خطية معينة من المعلمات.
إذا كان هناك عدم خطية كبير من العلاقة، يمكن أن تكون معلمة الخطية. لهذا الغرض، ستاتيستيكا يقدم تحليل الانحدار الثابت غير الخطية. لبدء التحليل، انتقل إلى القائمة: إحصائيات - & غ؛ المتقدم الخطي / نماذج غير الخطية - & غ؛ ثابت الانحدار غير الخطية. وبصفة عامة، أثبتت الشيكات التي أجريت أن تحليل الانحدار المتعدد غير حساس لمقدار معتدل من الضوضاء في البيانات التي تم تحليلها.
4. تحليل الانحدار باعتباره محسن الاستراتيجية.
وبما أن تحليل الانحدار قادر على معالجة آلاف المعلمات، فإنه يمكن استخدامه لتحسين الاستراتيجيات. وبالتالي، إذا كانت هناك حاجة إلى معالجة 50 فترة لمؤشر، يمكن حفظها كمعلمات فردية 50 وإرسالها إلى تحليل الانحدار، في كل مرة. جدول في ستاتيستيكا يمكن أن تناسب 65536 المعلمات. عند معالجة 50 فترات لكل مؤشر، يمكن تحليل حوالي 1300 المؤشرات! وهو أبعد بكثير من قدرات اختبار ميتاتريدر 5 القياسية.
دعونا تحسين البيانات المستخدمة في مثالنا بنفس الطريقة. وكما ذكر في القسم 4-1 أعلاه، من أجل إظهار التحسين، أضيفت قيم المؤشر مع فترة ضعف طول المعيار القياسي إلى البيانات. تنتهي أسماء هذه المعلمات في ملفات البيانات ب '_p'. عينة لدينا الآن يحتوي على 60 المعلمات بما في ذلك مؤشرات الفترة القياسية. بعد الخطوات الموضحة في القسم 3.2، سوف نحصل على جدول كما يلي (الشكل 11).
الشكل 11. نتائج تحليل المؤشرات بفترات مختلفة.
وقد تضمنت معادلة الانحدار 11 معلما: ستة من مؤشرات الفترة القياسية وخمسة من مؤشرات الفترة الممتدة. ارتفع ارتباط المعلمات مع السعر بمقدار ربع. ويبدو أن معلمات مؤشر الماكد لكلتا الفترتين قد أدرجت في المعادلة.
وبما أن قيم نفس المؤشر لفترات مختلفة تعامل كمعلمات مختلفة في تحليل الانحدار، يمكن أن تشتمل المعادلة على قيم المؤشرات وتدمجها لفترات مختلفة. مثلا قد يكتشف التحليل أن مؤشر القوة النسبية (7) يرتبط مع زيادة السعر وقيمة رسي (14) ترتبط مع انخفاض السعر. التحليل من قبل اختبار القياسية ليست أبدا مفصلة جدا.
ومعادلة الانحدار التي تم توليدها على أساس التحليل الموسع (الشكل 11) هي كما يلي:
السعر = 297 + 173 * دديماركر - 65103 * داك - 177 * ديماركر + 28553 * Bulls_p - 24808 * أو - 1057032 * dMACDms_p + 2.41 * WPR_p - 2.44 * Stoch_m_p + 125536 * ماكدز + 18.65 * dRSI_p - 0.768 * دتشي.
دعونا نرى النتائج هذه المعادلة سوف تسفر في منطقة العد. ويبين الشكل 12 نتائج اختبار منطقة العد باستخدام البيانات من 1 يوليو إلى 1 سبتمبر 2018 التي تم تطبيقها في تحليل الانحدار. وقد حصلت على الرسم البياني أكثر سلاسة و إي أسفرت عن المزيد من الأرباح.
الشكل 12. أداء منطقة العد خلال فترة التدريب.
دعونا اختبار إي على مدى فترة الاختبار من 1 سبتمبر إلى 1 نوفمبر 2018. أصبح مخطط الربح أسوأ مما كان عليه في حالة إي مع مؤشرات الفترة القياسية فقط. قد تحتاج المعادلة التي تم إنشاؤها إلى التحقق من طبيعتها وعدم خطية المؤشرات الداخلية.
وبما أنه لوحظ عدم الإنحياز في مؤشرات الفترة القياسية، فقد يصبح من الأهمية بمكان على مدى الفترة الممتدة. في هذه الحالة، يمكن تحسين أداء المعادلة عن طريق خطي المعلمات. وفي كلتا الحالتين، لم يكن التقييم البيئي انهيارا كاملا خلال فترة الاختبار، ببساطة لم يحقق الربح. هذا يؤهل استراتيجية المتقدمة كما مستقرة تماما.
الشكل 13. أداء منطقة العد خلال فترة الاختبار.
وتجدر الإشارة إلى أن MQL5 يدعم إخراج المعلمات فقط 64 في سطر واحد من ملف. وسوف يتطلب تحليل واسع النطاق للمؤشرات على مدى فترات مختلفة دمج جداول البيانات التي يمكن القيام بها في ستاتيستيكا أو مس إكسيل.
استنتاج.
وقد أظهرت دراسة صغيرة قدمت في المقالة أن تحليل الانحدار يوفر فرصة للاختيار من بين مجموعة متنوعة من المؤشرات أهمها من حيث التنبؤ بالأسعار. وقد أثبتت أيضا أن تحليل الانحدار يمكن استخدامها للبحث عن فترات المؤشرات التي هي الأمثل ضمن عينة معينة.
وتجدر الإشارة إلى أن معادلات الانحدار تتحول بسهولة إلى لغة MQL5 وتطبيقها لا يتطلب كفاءة عالية في البرمجة. وهكذا، يمكن استخدام تحليل الانحدار المتعدد في تطوير استراتيجية التداول. ومع ذلك، يمكن أن تكون معادلة الانحدار بمثابة العمود الفقري لاستراتيجية التداول.
ترجمة من الروسية من قبل شركة ميتاكوتس سوفتوار Corp.

تحليل الانحدار واستراتيجيات التداول الكمي
ودي كريك، كولورادو، يونيو 2018.
& # 8220؛ & # 8230؛ الصورة الحجرية التي تحولت إلى الجدار & # 8230؛ & # 8221؛
غلاف عادي هنا.
دابليو دابليو نورتون & # 8217؛ طبع ورقي من العظام الجافة في الوادي متاح في الولايات المتحدة اعتبارا من 6 أبريل 2018. وسوف تناسب في جيب كبير ومناسبة للسفر والقراءة والحشرات سواتينغ، وغيرها من الاستخدامات. يمكن العثور على روابط لتجار التجزئة على صفحة الكتاب.
في شركة جيدة.
في نهاية الأسبوع الماضي حضرت لجوائز لوس انجليس تايمز كتاب والمهرجان. وبحلول يوم، كانت أشجار جاكاراندا في ازهر؛ I & # 8217؛ لم تشاهد أبدا الأشجار التي الأرجواني قبل. ليلة السبت، وسوف تتوقف أبدا تسريحات تحت النجوم من السماء، الجفون العظام في وادي أخذ الجائزة في فئة الغموض / الإثارة. في الحفل، لعبت اللجنة الرباعية سلسلة أوف الفائزين على وخارج المسرح. أنا لا & # 8217؛ عادة ما الغراب عن الكتاب على هذه الصفحة بالذات، ولكن مهلا، شعرت ولا تزال تشعر وكأنها غريبة وحلم مثل أي شيء آخر & # 8230؛
السماء قبل اللوحة من السماء.
"بالنسبة لأولئك الذين يكتبون الشعر، وتذكر حياة ستانلي كونيتز وعمله لنا أنه على الرغم من أننا قد ولدنا في عالم غريب الذي يقول لنا أن يكون من الصعب والفصل، هو دعوتنا للرقص على فرحة البقاء على قيد الحياة على حافة من الطريق. يجب أن نكون واثقين من أننا سوف تتغير، ومع ذلك يجب أن نظل متواضعين. الشعر هو ظاهرة ضرورية وطبيعية، لا متفوقة على عمل يرقات الخنفساء السلحفاة ولا أقل رائعا. يجب علينا أن نختار الحب قبل قصة الحب، السماء قبل رسم السماء، أزهار الجنطيان قبل قصيدة، على الرغم من تلك تلك الخيارات قد تؤدي إلى حسرة. يجب أن نكون طيبين. يجب أن نكون حاضرين. ويذكرنا كونيتز بعدم إهمال الحياة المتواضعة التي توفي في قصائدنا، ولا يقل عن ذلك أن تكون مضيئة لكونها عادية ".
- من "الرقص على فرح الباقين على قيد الحياة: تأملات ستانلي كونيتز على الكتابة الحياة" دانتي دي ستيفانو. ورايتر & # 8217؛ s كرونيكل، سبتمبر 2017.
تحقق من الغطاء على فابر & أمب؛ فابر & # 8217؛ s الطبعة (المملكة المتحدة).
"ليلة مشرقة مقمرة، واحدة من أبناء المزارع الذي عاش في لوين أون في نانت ذ بيتوس كان سيدفع عناوينه لفتاة في كلوغوين ي غوين، وقال انه سيلد تيلويث تيغ تتمتع أنفسهم على قدم وساق على مرج بالقرب من بحيرة كويلين. اقترب منهم، وقليلا فشيئا كان يقودها حلاوة ساحرة من موسيقاهم وحيوية لعبهم حتى انه قد حصلت داخل دائرة بهم. سرعان ما مرت نوعا من الإملائي عليه، حتى أنه فقد معرفته بالمكان، ووجد نفسه في بلد، أجمل كان قد رأيت من أي وقت مضى، حيث قضى الجميع وقته في الإيقاع والبهجة. كان هناك سبع سنوات، ومع ذلك يبدو له ولكن حلم ليلة. ولكن تذكر باهتة يأتي إلى عقله من الأعمال التي كان قد غادر المنزل، وشعر بالتوق إلى رؤية حبيبته واحدة. لذلك ذهب وطلب الإذن بالعودة إلى ديارهم، التي منحت له، جنبا إلى جنب مع مجموعة من الحضور لقيادة بلده إلى بلده؛ وفجأة، وجد نفسه، كما لو الاستيقاظ من حلم، على البنك حيث رأى عائلة عادلة مسلية أنفسهم. تحول إلى البيت، ولكن هناك وجد كل شيء تغير: والديه قتلى، وإخوته لا يمكن التعرف عليه، وكان حبيبته متزوجة من رجل آخر. ونتيجة لهذه التغييرات توفي كسر القلب في أقل من أسبوع بعد العودة ".
& # 8211؛ كما قال لجون ريس، مؤلف سلتيك فولكلور، ويلش & أمب؛ مانكس، المجلد الأول (1901)

الانحدار الخطي من الوقت والسعر.
وقد طبق المحللون الفنيون والكميون مبادئ إحصائية على السوق المالي منذ إنشائه. كانت بعض المحاولات ناجحة جدا في حين أن البعض لم يكن سوى شيء. والمفتاح هو إيجاد وسيلة لتحديد الاتجاهات السعرية دون قابلية الانحراف والتحيز للعقل البشري. أحد النهج التي يمكن أن تكون ناجحة للمستثمرين، وتتوفر في معظم أدوات الرسم البياني هو الانحدار الخطي.
يحلل الانحدار الخطي متغيرين منفصلين من أجل تحديد علاقة واحدة. في تحليل الرسم البياني، وهذا يشير إلى متغيرات الأسعار والوقت. ويعترف المستثمرون والتجار الذين يستخدمون الرسوم البيانية بالصعود والهبوط في السعر المطبوع أفقيا من يوم إلى يوم، دقيقة إلى دقيقة أو أسبوع إلى أسبوع، اعتمادا على الإطار الزمني تقييمها. النهج المختلفة للسوق هي ما يجعل تحليل الانحدار الخطي جذابا جدا. (مزيد من المعلومات حول التحليل الكمي في التحليل الكمي لصناديق التحوط.)
وقد استخدم الإحصائيون طريقة منحنى الجرس، المعروف أيضا باسم التوزيع الطبيعي، لتقييم مجموعة معينة من نقاط البيانات. الشكل 1 هو مثال على منحنى الجرس، الذي يدل عليه الخط الأزرق الداكن. ويمثل منحنى الجرس شكل مختلف حالات نقاط البيانات. الجزء الأكبر من النقاط عادة ما يحدث نحو منتصف منحنى الجرس، ولكن مع مرور الوقت، والنقاط ضالة أو تحيد عن السكان. وغالبا ما تكون النقاط غير العادية أو النادرة خارج نطاق السكان "العاديين".
الشكل 1: منحنى الجرس، التوزيع الطبيعي.
كنقطة مرجعية، من الشائع متوسط ​​القيم لإنشاء درجة متوسطة. ولا يمثل المتوسط ​​بالضرورة وسط البيانات، ويمثل بدلا من ذلك متوسط ​​النقاط بما في ذلك جميع نقاط البيانات البعيدة. وبعد تحديد المتوسط، يحدد المحللون عدد المرات التي ينحرف فيها السعر عن المتوسط. الانحراف المعياري إلى جانب واحد من المتوسط ​​هو عادة 34٪ من البيانات، أو 68٪ من نقاط البيانات إذا نظرنا إلى واحد إيجابي وانحراف معياري واحد سلبي، وهو ما يمثله قسم السهم البرتقالي. اثنين من الانحرافات المعيارية تشمل ما يقرب من 95٪ من نقاط البيانات وأقسام البرتقال والوردي تضاف معا. تحدث حالات نادرة جدا، ممثلة بالسهم الأرجواني، في ذيول منحنى الجرس. لأن أي نقطة البيانات التي تظهر خارج اثنين من الانحرافات المعيارية نادرة جدا، وغالبا ما يفترض أن نقاط البيانات سوف تتحرك مرة أخرى نحو المتوسط ​​أو التراجع. (لمزيد من القراءة، انظر الحافظة الحديثة الإحصاءات نظرية التمهيدي.)
سعر السهم كمجموعة بيانات.
تخيل لو أخذنا منحنى الجرس، انقلبت على جانبها وتطبيقه على مخطط الأسهم. وهذا من شأنه أن يسمح لنا أن نرى عندما يكون الأمن مبالغا فيه أو مبالغة في البيع وعلى استعداد للعودة إلى المتوسط. في الشكل 2، تتم إضافة دراسة الانحدار الخطي إلى الرسم البياني، مما يعطي المستثمرين القناة الخارجية الزرقاء وخط الانحدار الخطي من خلال منتصف نقاط السعر لدينا. هذه القناة تظهر للمستثمرين اتجاه السعر الحالي ويوفر قيمة متوسطة. باستخدام الانحدار الخطي المتغير، يمكننا تعيين قناة ضيقة عند انحراف معياري واحد، أو 68٪، لإنشاء قنوات خضراء. في حين لا يوجد منحنى جرس، يمكننا أن نرى أن هذا السعر يعكس الانقسامات منحنى الجرس، كما هو مبين في الشكل 1.
الشكل 2: توضيح تداول متوسط ​​العائد باستخدام أربع نقاط.
تداول انعكاس المتوسط.
ويوفر الرقم 2 نقطة وقف الخسارة في حالة استمرار تأثير القيم المتطرفة سلبا على السعر. تحديد أمر وقف الخسارة يحدد بسهولة مبلغ المخاطر التجارية.
وسيتم تعيين هدفين السعر في NO.3 و No.4 للخروج المربحة. كان أول توقع لدينا مع التجارة العودة إلى خط الوسط، وفي الشكل 2، فإن الخطة هي الخروج من نصف الموقف بالقرب من 26.50 $ أو القيمة المتوسطة الحالية. الهدف الثاني يعمل تحت افتراض اتجاه مستمر، لذلك سيتم تعيين هدف آخر في الطرف الآخر من القناة لخط الانحراف المعياري الآخر، أو 31.50 $. تحدد هذه الطريقة المكافأة المحتملة للمستثمر.
الشكل 3: تعبئة السعر المتوسط.
مع مرور الوقت، سوف يتحرك السعر صعودا وهبوطا، وسوف تشهد قناة الانحدار الخطي تغييرات مع انخفاض الأسعار القديمة وظهور أسعار جديدة. ومع ذلك، يجب أن تظل األهداف واملواقف كما هي حتى يملأ هدف السعر املتوسط) انظر الشكل 3 (. عند هذه النقطة، تم تأمين الربح، ويجب أن يتم نقل وقف الخسارة إلى سعر الدخول الأصلي. على افتراض أنها سوق فعالة وسائلة، والباقي من التجارة يجب أن يكون من دون مخاطر. (مزيد من المعلومات في العمل من خلال فرضية السوق الفعالة.)
الشكل 4: تعبئة السعر المتوسط.
تذكر، الأمن لا يجب أن تغلق بسعر معين لطلبك لملء؛ فإنه يحتاج فقط للوصول إلى السعر اللحظي. قد تكون قد ملأت على الهدف الثاني خلال أي من المناطق الثلاثة في الشكل 4.
الفنيين وكبار التجار غالبا ما تعمل نظام واحد لأمن معين أو الأسهم وتجد أن نفس المعايير لن تعمل على الأوراق المالية الأخرى أو الأسهم. جمال الانحدار الخطي هو أن سعر الأمن والفترة الزمنية تحدد معلمات النظام. استخدام هذه الأدوات والقواعد المحددة في هذه المقالة على مختلف الأوراق المالية والأطر الزمنية، وسوف يفاجأ في طبيعتها العالمية. (لمزيد من القراءة، انظر تحسين محفظتك مع ألفا وبيتا وأسلوب الأمور في النمذجة المالية.)

تحليل الانحدار.
6 - البيانات المالية 7 - النسب المالية 8 - الأصول 9 - الخصوم 10 - الأعلام الحمراء.
16 - الاستثمارات البديلة 17 - إدارة الحافظة.
يتم إنشاء الانحدار الخطي من خلال تركيب خط من خلال مؤامرة مبعثر من الملاحظات المقترنة بين متغيرين. ويوضح الرسم البياني أدناه مثالا لخط الانحدار الخطي الذي تم رسمه من خلال سلسلة من الملاحظات (X، Y):
وعادة ما يتم تحديد خط الانحدار الخطي كميا من خلال إجراء أفضل تناسب مثل المربعات الصغرى (أي المسافة بين خط الانحدار وكل ملاحظة يتم تصغيرها). في الانحدار الخطي، يتم رسم متغير واحد على المحور X والآخر على Y. ويقال إن المتغير X هو المتغير المستقل، ويقال أن Y هو المتغير التابع. عند تحليل متغيرين عشوائيين، يجب عليك اختيار المتغير المستقل والذي يعتمد. ويأتي اختيار المستقل والمستقل من الفرضية - بالنسبة للعديد من الأمثلة، ينبغي أن يكون هذا التمييز بديهيا. الاستخدام الأكثر شعبية لتحليل الانحدار هو على عوائد الاستثمار، حيث مؤشر السوق مستقل في حين أن الأمن الفردي أو صندوق الاستثمار المشترك يعتمد على السوق. في جوهرها، تحليل الانحدار يصوغ فرضية أن الحركة في متغير واحد (Y) يعتمد على حركة في الآخر (X).
وتصف معادلة الانحدار العلاقة بين متغيرين وتعطى بالصيغة العامة:
حيث: Y = المتغير التابع. X = متغير مستقل،
a = اعتراض خط الانحدار؛ b = منحدر خط الانحدار،
استنتاج النتائج حول المتغير التابع يتطلب أن نجعل ستة افتراضات، الافتراضات الكلاسيكية فيما يتعلق نموذج الانحدار الخطي:
وتكون العلاقة بين المتغير التابع Y والمتغير المستقل X خطية في المنحدر ومعلمات الاعتراض a و b. ويعني هذا المتطلب أنه لا يمكن ضرب معلمة الانحدار أو تقسيمها على معلمة انحدار أخرى (مثل a / b)، وأن كلا المعلمتين تثاران إلى القدرة الأولى فقط. وبعبارة أخرى، لا يمكننا إنشاء نموذج خطي حيث كانت المعادلة Y = a + b 2 X + & إبسيلون؛ حيث أن تغيرات الوحدة في X سيكون لها تأثير b 2 على a، وتكون العلاقة غير خطية. المتغير المستقل X ليس عشوائيا. القيمة المتوقعة لمصطلح الخطأ & كوت؛ & إبسيلون؛ & كوت؛ هي 0. تسمح الافتراضتان رقم 2 و 3 بالنموذج الانحداري الخطي بإنتاج تقديرات للانحدار b والاعتراض a. ويكون التباين في طول الخطأ ثابتا لجميع الملاحظات. ويعرف الافتراض رقم 4 باسم & كوت؛ افتراض هوموسكيداستيسيتي & كوت ؛. وعندما يكون الانحدار الخطي متغايرا، تختلف قيم الخطأ الخاصة به وقد لا يكون النموذج مفيدا في التنبؤ بقيم المتغير التابع. مصطلح الخطأ و إبسيلون. غير مترابطة عبر الملاحظات؛ وبعبارة أخرى، يفترض أن التباين بين مصطلح الخطأ من ملاحظة واحدة وخطأ الخطأ من الآخر هو 0. وهذا الافتراض ضروري لتقدير الفروق في البارامترات. توزيع مصطلحات الخطأ أمر طبيعي. يسمح الافتراض رقم 6 بطرق اختبار الفرضية التي سيتم تطبيقها على نماذج الانحدار الخطي. خطأ قياسي في التقدير.
سي المختصرة، هذا المقياس يعطي مؤشرا على مدى نجاح نموذج الانحدار الخطي. ويقارن بين القيم الفعلية في المتغير التابع Y والقيم المتوقعة التي كان يمكن أن تؤدي إلى أن Y اتبعت بالضبط من الانحدار الخطي. على سبيل المثال، أن تأخذ قضية حيث قام المحلل المالي للشركة بتطوير نموذج الانحدار المتعلق بنمو الناتج المحلي الإجمالي السنوي إلى نمو مبيعات الشركة من خلال المعادلة Y = 1.4 + 0.8X.
ولإيجاد الخطأ المعياري للتقدير، نأخذ مجموع كل المصطلحات المتبقية المربعة ونقسمها (n - 2)، ثم نأخذ الجذر التربيعي للنتيجة. في هذه الحالة، يكون مجموع المخلفات المربعة 0.09 + 0.16 + 0.64 + 2.25 + 0.04 = 3.18. مع خمس ملاحظات، n - 2 = 3، و سي = (3.18 / 3) 1/2 = 1.03٪.
ومثل الخطأ المعياري، تعطي هذه الإحصائية مؤشرا على مدى نجاح نموذج الانحدار الخطي كمقدر للقيم للمتغير التابع. وهو يعمل من خلال قياس جزء التغير الكلي في المتغير التابع الذي يمكن تفسيره بالتغير في المتغير المستقل.
مجموع التباين الكلي الاختلاف.
وبالنسبة لأي من معامل الانحدار (اعتراض a أو ميل b)، يمكن تحديد فترة الثقة بالمعلومات التالية:
قيمة معلمات مقدرة من عينة خطأ معياري في التقدير (سي) مستوى الأهمية للتوزيع t درجات الحرية (أي حجم العينة - 2)
بالنسبة لمعامل الانحدار، تعطى صيغة فترة الثقة بواسطة b & بلوسمن؛ t c * سي، حيث t c هي قيمة t الحرجة على مستوىنا المختار.
وكثيرا ما يتم اختبار معاملات الانحدار باستخدام إجراء اختبار الفرضية. اعتمادا على ما يعتزم المحلل إثباته، يمكننا اختبار معامل الانحدار لتحديد ما إذا كان يفسر الفرص في المتغير التابع، ومدى ما يفسر التغييرات. يمكن تحديد معامل البيتا (معامل الانحدار) إما أن تكون أعلى أو أقل من 1 (أكثر تقلبا أو أقل تقلبا من السوق). ويمكن اختبار ألفاس (معامل الاعتراض) على الانحدار بين صندوق الاستثمار المشترك ومؤشر السوق ذات الصلة لتحديد ما إذا كان هناك دليل على ألفا إيجابية بما فيه الكفاية (مما يشير إلى القيمة المضافة من قبل مدير الصندوق).
من عينة لدينا، كنا قدرت ب 1.18 والخطأ القياسي من 0.147. يتم حساب إحصائية الاختبار لدينا باستخدام هذه الصيغة: t = معامل المقدرة - معامل افتراضي. / خطأ قياسي = (1.18 - 1.0) /0.147 = 0.18 / 0.147، أو t = 1.224.
امتحان كفا من المرجح أن تعطي إحصاءات موجزة من الانحدار الخطي وطلب تفسير. لتوضيح ذلك، افترض الاحصاءات التالية للانحدار بين صندوق النمو صغير كاب ومؤشر راسل 2000:
ماذا يقول لنا كل من هذه الأرقام؟
وتبلغ نسبة التغير في الصندوق نحو 75٪، وهو ما يفسره التغيرات في مؤشر راسل 2000. وهذا صحيح لأن مربع معامل الارتباط، (0.864) 2 = 0.746، يعطينا معامل التحديد أو R-سكارد. وسيؤدي أداء الصندوق إلى انخفاض طفيف في أداء المؤشر عندما تكون عوائد المؤشرات ثابتة. وهذا ينتج عن قيمة اعتراض يجري -0.417. عندما X = 0 في معادلة الانحدار، المتغير التابع يساوي اعتراض. وسيكون الصندوق في المتوسط ​​أكثر تقلبا من المؤشر. وتأتي هذه الحقيقة من منحدر خط الانحدار 1.317 (أي لكل تغيير بنسبة 1٪ في المؤشر، فإننا نتوقع أن يعود العائد إلى التغيير بنسبة 1.317٪). وسوف يتفوق الصندوق في فترات السوق القوية، وأداء ضعيف في الأسواق الضعيفة. هذه الحقيقة تأتي من الانحدار. ويتم التعويض عن مخاطر إضافية بمكافأة إضافية، مع عكس العكس في الأسواق المتدنية. القيم المتوقعة لعائد الصندوق، نظرا لعائد للسوق، يمكن العثور عليها من خلال حل Y = -0.417 + 1.317X (X = راسل 2000 ريتورن). تحليل التباين (أنوفا)
تحليل التباين أو أنوفا هو إجراء يتم فيه تقسيم التغير الكلي للمتغير العشوائي إلى مكونات بحيث يمكن فهمه بشكل أفضل أو يعزى إلى كل من المصادر المختلفة التي تتسبب في تغير العدد.
وتعطى الصيغة F - الإحصائية في الانحدار مع متغير مستقل واحد من خلال ما يلي:
F = متوسط ​​الانحدار مجموع المربعات / متوسط ​​الخطأ التربيعي.
الاختصاران لفهم هما رسس و سس: رسس، أو مجموع الانحدار من المربعات، هو مقدار التغير الكلي في المتغير التابع Y الموضح في معادلة الانحدار. ويحسب رسس بحساب كل انحراف بين قيمة Y المتوقعة ومتوسط ​​قيمة Y، وتربيع الانحراف، وإضافة كل المصطلحات. إذا لم يفسر متغير مستقل أيا من الاختلافات في متغير تابع، فإن القيم المتوقعة من Y تساوي القيمة المتوسطة، و رسس = 0. سس، أو مجموع الخطأ التربيعي للمتبقي، يتم حسابه من خلال إيجاد الانحراف بين توقع Y و Y الفعلي، وتربيع النتيجة وإضافة جميع الشروط. تسس، أو الاختلاف الكلي، هو مجموع رسس و سس. وبعبارة أخرى، هذه العملية أنوفا يكسر التباين إلى جزأين: واحد هو موضح من قبل النموذج واحد غير. أساسا، للحصول على معادلة الانحدار لديها جودة تنبؤية عالية، ونحن بحاجة إلى رؤية عالية رسس وانخفاض سس، الأمر الذي سيجعل نسبة (رسس / 1) / [سس / (n - 2)] عالية و (على أساس مقارنة مع قيمة F الحرجة) ذات دلالة إحصائية. وتؤخذ القيمة الحرجة من التوزيع F وتستند إلى درجات من الحرية.
وكثيرا ما تستخدم نماذج الانحدار لتقدير الإحصاءات الاقتصادية مثل التضخم ونمو الناتج المحلي الإجمالي. افترض أن الانحدار التالي يتم بين التضخم السنوي (X، أو المتغير المستقل) والعدد الفعلي (Y، أو المتغير التابع):
The predictions based on this model seem to work best for typical inflation estimates, and suggest that extreme estimates tend to overstate inflation - e. g. an actual inflation of just 4.46 when the estimate was 4.7. The model does seem to suggest that estimates are highly predictive. Though to better evaluate this model, we would need to see the standard error and the number of observations on which it is based. If we know the true value of the regression parameters (slope and intercept), the variance of any predicted Y value would be equal to the square of the standard error.
Where: s 2 is the squared standard error of the estimate, n is number of observations, X is the value of the independent variable used to make the prediction, X is the estimated mean value of the independent variable, and s x 2 is the variance of X.

Multiple Regression Analysis. Strategy Generator and Tester in One.
المقدمة.
An acquaintance of mine when attending a Forex trading course, once received an assignment to develop a trading system. After having trouble with it for about a week, he said, that this task was probably more difficult than writing a thesis. It was then that I suggested using the multiple regression analysis. As a result, a trading system developed from scratch overnight was successfully approved by the examiner.
The success of using the multiple regression is in the ability to quickly find relationships between indicators and price. The relationships detected allow to predict the price value based on the indicator values with a certain degree of probability. Modern statistical software allows to simultaneously filter thousands of parameters in trying to find these relationships. This can be compared to industrial sifting gold from gravel.
A ready to use strategy as well as a strategy generator will be developed by loading the indicator data into the multiple regression analysis and applying data manipulation, respectively.
This article will demonstrate the process of creating a trading strategy using the multiple regression analysis.
1. Developing a Robotrader - Piece of Cake!
The backbone of the trading system developed overnight as mentioned earlier was one sole equation:
where if Reg >0, then we buy, and if Reg < 0, we sell.
The equation was an outcome of the multiple regression analysis that used the data sample from standard indicators. An EA was developed on the basis of the equation. The piece of code in charge of trading decisions virtually consisted of 15 lines only. The EA with a complete source code is attached (R_check).
The data sample for the regression analysis was collected on EURUSD H1 over two months from July 1, 2018 to August 31, 2018.
Fig. 1 shows the EA performance results over the data period for which it was developed. It is peculiar that superprofit, which is often the case in the Tester, was not observed on the training data. It must be a sign of lack of reoptimization.
Fig. 1. EA performance over the training period.
Fig. 2 demonstrates the EA performance results on the test data (from September 1 to November 1, 2018). It appears that the two-month data was sufficient for the EA to remain profitable for another two months. That said, the profit made by the EA over the testing period was the same as over the training period.
Fig. 2. EA performance over the testing period.
Thus, based on the multiple regression analysis a fairly simple EA was developed yielding profit beyond the training data. The regression analysis can therefore be successfully applied when building trading systems.
However, resources of the regression analysis should not be overestimated. Its advantages and disadvantages will be set forth further below.
2. Multiple Regression Analysis.
The general purpose of the multiple regression is the analysis of the relationship between several independent variables and one dependent variable. In our case, it is the analysis of the relationship between values of indicators and the price movement.
In its simplest form, this equation may appear as follows:
Price change = a * RSI + b * MACD + с.
A regression equation can only be generated if there is a correlation between independent variables and a dependent variable. Since values of indicators are as a rule interrelated, the contribution made by indicators to the forecast may appreciably vary if an indicator is added or removed from the analysis. Please note that a regression equation is a mere demonstration of the numerical dependence and not a description of causal relationships. Coefficients (a, b) indicate the contribution made by every independent variable to its relationship with a dependent variable.
A regression equation represents an ideal dependence between the variables. This is however impossible in Forex and the forecast will always differ from the reality. Difference between the predicted and observed value is called the residual. Analysis of residuals allows to identify inter alia a nonlinear dependence between the indicator and price. In our case, we assume that there is only nonlinear dependence between indicators and price. Fortunately, the regression analysis is not affected by minor deviations from linearity.
It can only be used to analyze quantitative parameters. Qualitative parameters that do not have transitional values are not suitable for the analysis.
The fact that the regression analysis can process any number of parameters may lead to the temptation to include into analysis as many of them as possible. But if the number of independent parameters is bigger than the number of observations of their interaction with a dependent parameter, there is a great chance of getting equations producing good forecasts which are however based on random fluctuations.
The number of observations shall be 10-20 times bigger than the number of independent parameters.
In our case, the number of indicators contained in the data sample shall be 10-20 times bigger than the number of trades in our sample. The equation generated will then be considered reliable. The sample based on which the Robotrader as described in section 1 was developed, contained 33 parameters and 836 observations. As a result, the number of parameters was 25 times bigger than the number of observations. This requirement is a general rule in statistics. It is also applicable to the MetaTrader 5 Strategy Tester optimizer.
Furthermore, every given value of the indicator in the optimizer is in fact a separate parameter. In other words, when testing 10 indicator values, we are dealing with 10 independent parameters which shall be taken into consideration in order to avoid reoptimization. A report of the optimizer should probably include another parameter: average number of trades/number of values of all optimized parameters . If the indicator value is less than ten, chances are that reoptimization will be required.
Another thing to be considered is outliers. Rare yet powerful events (in our case price spikes) may add false dependencies to the equation. For example, following the unexpected news, the market responded with substantial movements lasting for a few hours. The values of technical indicators would in this case be of little importance in the forecast yet they would be considered highly significant in the regression analysis as there was a marked price change. It is therefore advisable to filter the sample data or check it for possible outliers.
3. Creating Your Own Strategy.
We have approached the key part where we will see how to generate a regression equation based on your own data. Implementation of the regression analysis is similar to that of the discriminant analysis set forth earlier on. Regression analysis includes:
Preparation of data for the analysis ; Selection of the best variables from the prepared data; Obtaining a regression equation.
Multiple regression analysis is a part of numerous advanced software products intended for statistical data analysis. The most popular are Statistica (by StatSoft Inc.) and SPSS (by IBM Corporation). We will further consider the application of the regression analysis using Statistica 8.0.
3.1. Preparation of Data for the Analysis.
We are to generate a regression equation where the price behavior on the next bar can be predicted based on the indicator values on the current bar.
The same EA that was used for the discriminant analysis data preparation will be used for collecting data. We will expand its functionality by adding a function for saving indicator values with other periods. An extended set of parameters will be used for strategy optimization based on the analysis of the same indicators but with different periods.
To load data in Statistica, you should have a CSV file with a following structure. Variables shall be arranged in columns where every column corresponds to a certain indicator. The rows shall contain consecutive measurements (cases), i. e. values of indicators for certain bars. In other words, the horizontal table headers contain indicators, the vertical table headers contain consecutive bars.
Indicators to be analyzed are:
Every data row of our file will contain:
Changes in price on the bar between Open and Close; Values of indicators observed on the preceding bar.
Thus, we will generate an equation describing the future price behavior based on the known indicator values.
Apart from the absolute indicator value, we need to save the difference between the absolute and the preceding values in order to see the direction of the change in indicators. The names of such variables in the example provided will have prefix 'd'. For signal line indicators, it is necessary to save the difference between the main and signal line as well as its dynamics. The names of the data collected by indicators with other periods end with '_p'.
In order to demonstrate the optimization, only one period was added, being twice the length of the standard period of the indicator. In addition, save the time of the new bar and the relevant hour value. Save the difference between Open and Close for the bar where the indicators are calculated. This will be required to filter outliers. As a result, 33 parameters will be analyzed to generate a multiple regression equation. The above data collection is implemented in the EA R_collection attached to the article.
The MasterData. CSV file will be created after starting the EA in terminal_data_directory/MQL5/Files. When starting the EA in the Tester, it will be located in terminal_data_directory/tester/Agent-127.0.0.1-3000/MQL5/Files. The file as obtained can be used in Statistica.
An example of such file can be found in MasterDataR. CSV. The data was collected for EURUSD H1 from January 3, 2018 to November 11, 2018 using the Strategy Tester. Only the August and September data was used in the analysis. The remaining data was saved in a file for you to practice.
In order to open the. CSV file in Statistica, do as follows.
In Statistica, go to menu File > Open, select the file type 'Data files' and open your. CSV file. Leave Delimited in the Text File Import Type window and click OK. Enable the underlined items in the opened window. Bear in mind to put the decimal point in the Decimal separator character field regardless of whether it is already there or not.
Fig. 3. Importing the file into Statistica.
Click OK to get the table containing our data which is ready for the multiple regression analysis. An example of the obtained file to be used Statistica can be found in MasterDataR. STA.
3.2. Automatic Selection of Indicators.
Run the regression analysis (Statistics->Multiple Regression).
Fig. 4. Running the regression analysis.
In the opened window, go to the Advanced tab and enable the marked items. Click the Variables button.
Select the Dependent variable in the first field and Independent variables based on which the equation will be generated - in the second field. In our case, select the Price parameter in the first field and Price 2 to dWPR - in the second field.
Fig. 5. Preparation to selection of parameters.
Click the Select Cases button (Fig. 5).
A window will open for selection of cases (data rows) which will be used in the analysis. Enable items as shown in Fig. 6.
Fig. 6. Selection of cases.
Specify the data pertaining to July and August that will be used in the analysis. These are cases from 3590 to 4664. The numbers of cases are set via the variable V0. In order to avoid the effect of outliers and price spikes, add data filtering by price.
Include in the analysis only those indicator values for which the difference between Open and Close on the last bar is not more than 250 points. By specifying here the rules for selecting cases for the analysis, we have set a data sample for regression equation generation. Click OK here and in the window for preparation to selection of parameters (Fig. 5).
A window with options of the automatic data selection methods will open. Select the Forward Stepwise method (Fig. 7).
Fig. 7. Method selection.
انقر فوق موافق. And a window will open informing you that the regression analysis was successfully completed.
Fig. 8. Window of results of the regression analysis.
Automatic selection of parameters concerns only those that contribute materially to the multiple correlation between the parameters (independent variables) and the dependent variable. In our case, a set of indicators will be selected, best determining price. In effect, the automatic selection acts as a strategy generator. The generated equation will only consist of the indicators that are reliable and best describe the price behavior.
The upper part of the window of results (Fig. 8) contains statistical characteristics of the generated equation while the parameters included in the equation are listed at the bottom. Please pay attention to the underlined characteristics. Multiple R is the value of multiple correlation between the price and indicators included in the equation. "p" is the level of statistical significance of such correlation.
A level of less than 0.05 is considered statistically significant. "No. of cases" is the number of cases used in the analysis. The indicators whose contribution is statistically significant are displayed in red. Ideally, all indicators shall be marked in red.
The rules used in Statistica for including parameters in the analysis are not always optimal. For example, a great number of insignificant parameters may get included in a regression equation. We should therefore use our creativity and assist the program in selecting parameters.
If the list contains insignificant parameters, click Summary: Regression results.
A window will open displaying the data on every indicator (Fig. 9).
Fig. 9. Report on the parameters included in the regression equation.
Find an insignificant parameter with the highest p-level and remember its name. Go back to the step where the parameters were being included in the analysis (Fig. 7) and remove this parameter from the list of the parameters selected for the analysis.
To return, click Cancel in the window of the analysis results and repeat the analysis. Try to exclude all insignificant parameters in this manner. In so doing, look out for the obtained multiple correlation value (Multiple R) as it should not be considerably lower than the initial value. Insignificant parameters can be removed from the analysis one by one or all at once, the first option being more advisable.
As a result, the table now only contains the significant parameters (Fig. 10). The correlation value has decreased by 20% which is probably due to random coincidences. An infinitely long numerical series is known to have an infinite number of random coincidences.
Since data samples we process are quite large, random coincidences and random relationships are often the case. It is therefore important to use statistically significant parameters in your strategies.
Fig. 10. The equation includes the significant parameters only.
If following the selection of the parameters, a group of several indicators significantly correlating with the price cannot be formed, the price is likely to contain little information on the past events. Trades based on any technical analysis should in cases like this be very prudent or even suspended altogether.
In our case, only five out of 33 parameters have proven to be effective in developing a strategy on the basis of the regression equation. This quality of the regression analysis is of great benefit when selecting indicators for your own strategies.
3.3. Regression Equation and its Analysis.
So we ran the regression analysis and obtained the list of the 'right' indicators. Let us now transform it all into a regression equation. The equation coefficients for every indicator are shown in column B of the regression analysis results (Fig. 10). The Intercept parameter in the same table is an independent member of the equation and is included in it as an independent coefficient.
Let us generate an equation based on the table (Fig. 10), taking coefficients from column B.
Price = 22.7 + 205.2*dDemarker - 41686.2*dAC - 139.3*DeMarker + 22468.8*Bulls - 14619.5*Bears.
This equation was set forth earlier in section 1 as an MQL5 code along with the performance results obtained from the Tester for the EA developed on the basis of this equation. As can be seen, the regression analysis was adequate when used as a strategy tester. The analysis brought forward a certain strategy and selected relevant indicators from the proposed list.
In case you wish to further analyze the stability of the equation, you should check for:
Outliers in the equation; Normality of distribution of the residuals; Nonlinear effect produced by individual parameters within the equation.
These checks can be carried out using the residual analysis. To proceed to the analysis, click OK in the window of results (Fig. 8). After carrying out the above checks with regard to the generated equation, you will see that the equation does not appear to be sensitive to a small number of outliers, small deviation from the normal distribution of data and a certain nonlinearity of the parameters.
If there is a significant nonlinearity of relationship, a parameter can be linearized. For this purpose, Statistica offers a fixed nonlinear regression analysis. To start the analysis, go to the menu: Statistics -> Advanced Linear/Nonlinear Models -> Fixed Nonlinear Regression. In general, the performed checks have proven that the multiple regression analysis is not sensitive to a moderate amount of noise in the analyzed data.
4. Regression Analysis as a Strategy Optimizer.
Since the regression analysis is capable of processing thousands of parameters, it can be used to optimize strategies. Thus, if 50 periods for an indicator need to be processed, they can be saved as 50 individual parameters and sent to the regression analysis, all at once. A table in Statistica can fit 65536 parameters. When processing 50 periods for every indicator, around 1300 indicators can be analyzed! It is far beyond the capabilities of the MetaTrader 5 Standard Tester.
Let us optimize the data used in our example in the same way. As mentioned in section 4.1 above, in order to demonstrate the optimization, the indicator values with a period being twice the length of the standard one were added to the data. The names of these parameters in the data files end with '_p'. Our sample now contains 60 parameters including the standard period indicators. Following the steps as set forth in section 3.2, we will get a table as follows (Fig. 11).
Fig. 11. Results of the analysis of the indicators with different periods.
The regression equation has comprised 11 parameters: six from the standard period indicators and five from the extended period indicators. The correlation of the parameters with the price increased by a quarter. Parameters of the MACD indicator for both periods appeared to be included in the equation.
Since values of the same indicator for different periods are treated as different parameters in the regression analysis, the equation may comprise and combine values of the indicators for different periods. مثلا the analysis may discover that the RSI(7) value is associated with the price increase and RSI(14) value is associated with the price decrease. The analysis by the Standard Tester is never so detailed.
The regression equation generated on the basis of the extended analysis (Fig. 11), is as follows:
Price = 297 + 173*dDemarker - 65103*dAC - 177*DeMarker + 28553*Bulls_p - 24808*AO - 1057032*dMACDms_p + 2.41*WPR_p - 2.44*Stoch_m_p + 125536*MACDms + 18.65*dRSI_p - 0.768*dCCI.
Let us see the results this equation will yield in the EA. Fig. 12 shows the results of testing the EA using the data from July 1 to September 1, 2018 that was applied in the regression analysis. The chart has got smoother and the EA has yielded more profit.
Fig. 12. EA performance over the training period.
Let us test the EA over the testing period from September 1 to November 1, 2018. The profit chart has become worse than it was in case with the EA with standard period indicators only. The equation as generated might need to be checked for normality and nonlinearity of internal indicators.
Since nonlinearity was observed in standard period indicators, it could become critical over the extended period. In this case, the equation performance can be improved by linearizing the parameters. Either way, the EA was not a total meltdown over the testing period, it simply did not profit. This qualifies the developed strategy as quite stable.
Fig. 13. EA performance over the testing period.
It should be noted that MQL5 supports the output of only 64 parameters in one line of a file. A large-scale analysis of indicators over various periods will require merging the data tables which can be done in Statistica or MS Excel.
استنتاج.
A small study presented in the article has shown that the regression analysis provides an opportunity to select from a variety of indicators the most significant ones in terms of price prediction. It has also demonstrated that the regression analysis can be used to search for indicator periods that are optimal within a given sample.
It should be noted that regression equations are easily transformed into MQL5 language and their application does not require high proficiency in programming. Thus, the multiple regression analysis can be employed in trading strategy development. That said, a regression equation can serve as a backbone for a trading strategy.
ترجمة من الروسية من قبل شركة ميتاكوتس سوفتوار Corp.

Comments

Popular Posts