پیمایش نوآوری در کانادا

بررسی استراتژی نوآوری و کسب و کار (SIBS) یک بررسی بین اقتصادی از شرکت های تجاری و سازمان های صنعتی غیرانتفاعی در کانادا است.
مفاهیم و تعاریف به کار رفته در جمع آوری و انتشار داده های نوآوری در کتابچه راهنمای اسلو ارائه شده است: راهنمای جمع آوری و تفسیر داده های نوآوری، ویرایش چهارم سازمان همکاری و توسعه اقتصادی، OECD و Eurostat، 2018.
“نوآوری یک محصول یا فرآیند (یا ترکیبی از آنها) جدید یا بهبود یافته است که به طور قابل توجهی با محصولات یا فرآیندهای قبلی واحد متفاوت است و در دسترس کاربران بالقوه (محصول) قرار گرفته یا توسط واحد (فرایند) مورد استفاده قرار گرفته است.”
SIBS اطلاعات تکمیلی کیفی تجاری، از جمله ویژگی های بازار، استفاده از فناوری های پیشرفته، استراتژی کسب و کار، شیوه های تجاری و مشارکت در زنجیره های ارزش جهانی را جمع آوری می کند. این نظرسنجی همچنین اطلاعات کمی را در مورد کل فروش، هزینههای نوآوری، خرید کالاها و خدمات و پرسنل جمعآوری میکند که با توزیع درصدی توسط زیر گروههای مشخص تکمیل میشود.
دوره مرجع: سال مرجع نظرسنجی 2022 است. همچنین اطلاعات برای سه سال تقویمی (2020-2022) جمع آوری شده است.
1-عوامل مورد بررسی
- عملکرد تجاری و مالکیت
- نوآوری
- علم و تکنولوژی
2-جمعیت هدف
جمعیت هدف برای بررسی استراتژی نوآوری و کسب و کار محدود به شرکتهایی در 14 بخش زیر است که طبق سیستم طبقهبندی صنعت آمریکای شمالی ، آمار کانادا، 2017 تعریف شدهاند:
– کشاورزی، جنگلداری، ماهیگیری و شکار
– معادن، استخراج معادن و استخراج نفت و گاز
– خدمات شهری
– ساخت و ساز
– تولید
– تجارت عمده
– تجارت خرده فروشی
– حمل و نقل و انبارداری
– صنایع اطلاعاتی و فرهنگی
– امور مالی و بیمه به استثنای (مقامات پولی – بانک مرکزی) و (اشخاص با هدف خاص)
– املاک و مستغلات و اجاره و اجاره
– خدمات تخصصی، علمی و فنی
– مدیریت شرکت ها و بنگاه ها به استثنای (شرکت های هلدینگ)
– خدمات اداری و پشتیبانی، مدیریت پسماند و اصلاح
برای کاهش بار پاسخگویی بر مشاغل کوچک، تنها شرکت هایی با حداقل 20 کارمند و درآمد حداقل 250000 دلار برای انتخاب نمونه در نظر گرفته شدند.
3-طراحی ابزار
SIBS از یک پرسشنامه الکترونیکی استفاده می کند. این پرسشنامه برای انطباق با استانداردهای بین المللی برای مفاهیم نوآوری (OECD و Eurostat، 2018) ایجاد شده است. EQها روش اصلی جمعآوری هستند، و اینها با پاسخدهندگان سازمانی به زبان انگلیسی و فرانسوی برای تأیید درک پاسخدهندگان از اصطلاحات، مفاهیم و تعاریف، و همچنین توانایی آنها برای ارائه دادههای درخواستی و هدایت برنامههای EQ آزمایش شدند. این دور از آزمون بر اعتبار سنجی درک پاسخ دهندگان از مفاهیم، سؤالات، اصطلاحات، مناسب بودن دسته های پاسخ و در دسترس بودن اطلاعات درخواستی متمرکز بود.
طبقه بندی بر اساس سیستم طبقه بندی صنعت آمریکای شمالی (NAICS) کانادا 2017، منطقه و سه کلاس اندازه انجام شد.
NAICS سیستمی است که برای طبقه بندی مشاغل به صنایع مختلف بر اساس فعالیت های اقتصادی آنها استفاده می شود.
این منطقه به مناطق مختلف جغرافیایی در داخل کانادا اشاره دارد.
طبقات اندازه بر اساس تعداد کارمندان در هر شرکت است، شرکت های کوچک دارای 20 تا 99 کارمند، شرکت های متوسط با 100 تا 249 کارمند و شرکت های بزرگ دارای 250 کارمند یا بیشتر.
طرح نظرسنجی نیاز به سرشماری از تمام شرکت های بزرگ در 14 بخش داشت، به این معنی که داده ها از هر شرکت بزرگ در این بخش ها جمع آوری شد.
نمونه به طور تصادفی برای دستیابی به دو مجموعه از اهداف انتخاب شد.
هدف اول تولید تخمین نسبتها برای ویژگیهای تعریفشده برای کانادا و استانها یا مناطق منتخب بود.
برای اطمینان از صحت برآوردها از خطای استاندارد هدف (معیار کیفیت) استفاده شد.
هدف دوم اجازه دادن به تجزیه و تحلیل ریز داده ها در یک محیط فایل پیوندی بود، به این معنی که داده های سطح فردی را می توان در ترکیب با سایر منابع داده تجزیه و تحلیل کرد.
واحد نمونه گیری به سطحی که داده ها در آن جمع آوری می شود، اشاره دارد، در این مورد، این شرکت است.
طبقه بندی ملی بر اساس شرکت هایی بود که حداقل 250000 دلار درآمد در گروه های صنعتی هدف و اندازه شرکت داشتند.
طبقه بندی منطقه ای مبتنی بر شرکت هایی با حداقل 250000 دلار درآمد در گروه های صنعتی هدف برای مناطق خاص بود.
حجم نمونه برای این نظرسنجی 15103 شرکت بود که از جامعه هدف 74230 شرکت انتخاب شدند.
نرخ پاسخ مورد انتظار 50٪ بر اساس طبقه بود، به این معنی که پیش بینی می شد 50٪ از شرکت های منتخب به نظرسنجی پاسخ دهند.
خطاهای استاندارد هدف برای اطمینان از صحت نسبت های محاسبه شده تعریف شد.
داده ها از طریق پرسشنامه الکترونیکی EQ، با پیگیری بدون پاسخ و پیگیری ویرایشی ناموفق برای سوالات اولویت دار جمع آوری شد.
4-تشخیص خطا
تشخیص خطا یک گام مهم در فعالیت های جمع آوری داده ها و پردازش داده ها است.
در طول جمعآوری دادهها، ویرایشهای خودکار روی رکوردهای داده اعمال میشود تا خطاهای گزارشدهی شناسایی شوند. این ویرایشها به پرچمگذاری هرگونه اشتباه یا ناسازگاری در دادههای گزارششده کمک میکند.
در پردازش دادهها، ویرایشهای اضافی برای شناسایی خودکار خطاها یا ناهماهنگیهایی که ممکن است پس از جمعآوری همچنان در دادهها وجود داشته باشد، استفاده میشود.
داده های نامنسجم، به این معنی که داده هایی که منطقی نیستند یا متناقض هستند، بر اساس پاسخ به سؤالات کلیدی «دروازه» تصحیح می شوند. این سوالات دروازه ای به عنوان نقاط بازرسی برای اطمینان از صحت و انسجام داده ها عمل می کنند.
اگر سؤالات دروازه توسط پاسخ دهندگان گزارش نشود، تصحیح بر اساس داده های گزارش شده برای بخش انجام می شود. اگر هیچ داده گزارش شده ای در دسترس نباشد، برای تخمین مقادیر گمشده بر اساس پاسخ ها در لایه، از انتساب استفاده می شود. Imputation تکنیکی است که برای پر کردن داده های از دست رفته با تخمین مقادیر بر اساس سایر اطلاعات موجود استفاده می شود.
گزارش فروش و مخارج از پاسخ دهندگان خواسته می شود که فروش و هزینه ها را به هزار دلار گزارش کنند.
مجموع این مقادیر گزارش شده برای اطمینان از اینکه خطای قابل توجهی در گزارش وجود ندارد، مانند مقادیر گزارشگری که مرتبه های بزرگی متفاوت از آنچه مورد انتظار است، بررسی می شوند. به عنوان مثال، اگر پاسخگوی فروش را 100,000 به جای 100، گزارش دهد. این به عنوان یک خطای گزارش علامت گذاری می شود.
5-انتساب
Imputation فرآیندی است که برای رسیدگی به موارد بدون پاسخ، که اقلام دادهای هستند که توسط پاسخدهندگان گزارش نشدهاند، استفاده میشود.
در این مورد خاص، انتساب با استفاده از روشی به نام انتساب اهداکننده نزدیکترین همسایه در سیستم تعمیم یافته BANFF انجام می شود.
روش انتساب، مشابه ترین رکورد معتبر را برای هر رکوردی که نیاز به انتساب دارد، پیدا می کند. این بدان معناست که برای هر مقدار از دست رفته، رویه به دنبال رکورد مشابهی میگردد که مقدار معتبری برای آن آیتم خاص دارد.
شباهت بین رکوردها با در نظر گرفتن سایر متغیرهایی که با مقادیر از دست رفته مرتبط هستند تعیین می شود. این متغیرها برای ایجاد کلاسهای انتساب سفارشی و متغیرهای منطبق استفاده میشوند.
اگر مقادیر گمشدهای وجود داشته باشد که نزدیکترین اهداکنندگان همسایه را نمیتوان یافت، با گسترش کلاسهای انتساب و پردازش مجدد دادهها، فرآیند انتساب کمتر محدود میشود.
فرآیند انتساب در یک توالی از پیش تعیین شده ادامه می یابد تا زمانی که اهداکنندگان نزدیکترین همسایه به تمام رکوردهایی که نیاز به انتساب دارند اختصاص داده شوند یا تا زمانی که هیچ اهداکننده نزدیکترین همسایه در دسترس نباشد.
در طول فرآیند انتساب، ویرایشها و ویرایشهای پست اعمال میشوند تا اطمینان حاصل شود که رکورد حاصل هیچ یک از ویرایشهای مشخصشده را نقض نمیکند. این به حفظ یکپارچگی و سازگاری داده های منتسب کمک می کند.
6-برآورد کردن
مقادیر پاسخ برای واحدهای نمونه در وزن نهایی ضرب شد تا تخمینی برای کل جمعیت ارائه شود. وزن نهایی با استفاده از تعداد معینی از عوامل، مانند احتمال انتخاب واحد در نمونه، و تعدیل واحدهایی که امکان تماس با آنها وجود نداشت یا از پاسخ دادن امتناع کردند، محاسبه شد. با استفاده از یک تکنیک آماری به نام کالیبراسیون، مجموعه نهایی وزن ها به گونه ای تنظیم می شود که نمونه تا حد امکان نشان دهنده کل جامعه باشد.
خطای نمونهگیری با خطای استاندارد (SE) برای نسبتها و با ضریب تغییرات (CV) اندازهگیری شد که نشاندهنده نسبت تخمینی است که از تغییرپذیری مرتبط با آن حاصل میشود. SE و CV ها محاسبه شدند و در جداول داده ها با پرچم های کیفیت نشان داده شده اند.
فرآیندی که به عنوان تنظیم جدولی تصادفی (RTA) شناخته می شود، تخمین ها را با مقدار تصادفی تغییر می دهد و درجه ای از عدم قطعیت را به دقت تخمین اضافه می کند تا از افشای مقادیر فردی جلوگیری کند. در نتیجه، تخمینهایی که میتوانند پاسخ یک فرد را فاش کنند، منتشر نمیشوند. (توجه داشته باشید که اگر برآوردهای تعدیل شده بخشی از یک جدول با کل یا کل فرعی باشد، برآوردهای کل و فرعی مربوط نیز تعدیل خواهند شد.)
7-ارزیابی کیفیت
بررسی استراتژی های نوآوری و کسب و کار، سال مرجع 2022، شامل دو نوع سؤال اصلی است:
7-1 سوالات کیفی – کادر تیک (بله/خیر؛ بله/خیر/نمی دانم؛ بله/خیر/قابل اجرا نیست؛ یک مورد را انتخاب کنید؛ همه مواردی که اعمال می شوند را انتخاب کنید؛ مقیاس لیکرت)
اعتبار سنجی داده ها برای سوالات کیفی شامل حصول اطمینان از جریانات در پرسشنامه است که برای تأیید پاسخ صحیح جامعه به هر سؤال، انسجام در یک سؤال و سؤالات در یک ماژول موضوعی و انسجام بین سؤالات در پرسشنامه رعایت می شود.
7-2 سوالات کمی – ارز (هزار دلار)؛ استخدام پرسنل FTE؛ توزیع درصد (اجزا به 100٪ اضافه می شود)
برای سؤالات کمی دو فرآیند اصلی اعتبارسنجی وجود داشت: انسجام داده ها و رویارویی داده ها. انسجام دادهها شامل بررسی بخشهای مختلف پرسشنامه است که سؤالاتی را پوشش میدهد که مستقیم یا غیرمستقیم مرتبط هستند تا اطمینان حاصل شود که پاسخها با آنچه در عمل مشاهده شده مطابقت دارند.
مثال: درآمد هر کارمند در محدوده معینی برای هر قشر (گروه صنعت بر اساس اندازه شرکت) قرار می گیرد. اگر یک رکورد بسیار خارج از محدوده مقادیر معمولی باشد، می توان از رویارویی داده ها برای شناسایی یک خطای احتمالی استفاده کرد، مانند گزارش به دلار به جای هزاران دلار یا گزارش برای یک جزء از یک شرکت به جای کل شرکت
تقابل داده ها شامل مقایسه پاسخ پاسخ دهنده با سایر منابع اطلاعاتی در مورد آن پاسخ دهنده خاص یا سایر شرکت ها در آن صنعت است. برای SIBS، داده های اداری مختلفی برای مقابله با داده ها به دست آمد، از جمله:
– داده های مالیاتی (داده های درآمد T2 که برای طبقه بندی بر اساس اندازه و مقایسه پاسخ ها استفاده می شود)
– داده های استخدام (PD7)
– ثبت صادرکننده (اطلاعات اداری در مورد صادرات)
– مقایسه های تاریخی (در صورت وجود)
– اطلاعات در دسترس عموم برای شرکت های فردی (گزارش های سالانه شرکت های سهامی عام، اطلاعات در اینترنت)
به طور معمول، دادههای اداری برای دورههای زودتر از دوره مرجع برای نظرسنجی در دسترس هستند، اما میتوان از آنها برای شناسایی ترتیب بزرگی مسائل و مواردی که پاسخدهنده برای سطح متفاوتی از واحد تجاری گزارش میدهد، استفاده کرد.
8-کنترل افشاگری
Statistics Canada طبق قانون از انتشار هرگونه اطلاعاتی که جمعآوری میکند و میتواند هر شخص، کسبوکار یا سازمانی را شناسایی کند، منع میکند، مگر اینکه رضایت پاسخدهنده داده شده باشد یا طبق قانون آمار مجاز باشد. قوانین محرمانگی مختلفی برای همه دادههایی که منتشر یا منتشر میشوند اعمال میشود تا از افشای اطلاعات محرمانه جلوگیری شود.
فرآیندی که به عنوان تنظیم جدولی تصادفی (RTA) شناخته می شود، تخمین ها را با مقدار تصادفی تغییر می دهد و درجه ای از عدم قطعیت را به دقت تخمین اضافه می کند تا از افشای مقادیر فردی جلوگیری کند. در نتیجه، تخمینهایی که میتوانند پاسخ یک فرد را فاش کنند، منتشر نمیشوند. (توجه داشته باشید که اگر برآوردهای تعدیل شده بخشی از یک جدول با کل یا کل فرعی باشد، برآوردهای کل و فرعی مربوط نیز تعدیل خواهند شد.)
9-تجدید نظر و تعدیل فصلی
این روش برای این نظرسنجی اعمال نمی شود.
10-دقت داده ها
دو نوع خطا وجود دارد که می تواند بر داده ها تأثیر بگذارد: خطاهای نمونه گیری و خطاهای غیر نمونه گیری. خطاهای غیر نمونه برداری ممکن است به دلایل مختلف در طول جمع آوری و پردازش داده ها رخ دهد. به عنوان مثال، عدم پاسخگویی منبع مهمی از خطای عدم نمونه گیری است. تحت پوشش یا پوشش بیش از حد جامعه، تفاوت در تفسیر سؤالات و اشتباهات در ثبت و پردازش داده ها از دیگر نمونه های خطاهای غیر نمونه گیری است. این خطاها تا حد امکان از طریق طراحی دقیق پرسشنامه نظرسنجی و تأیید داده های نظرسنجی به حداقل می رسد.
10-1شاخصهای دقت دادههای مورد استفاده
عبارتند از خطای استاندارد و ضریب تغییرات. خطای استاندارد یک معیار آماری رایج است که نشان دهنده خطای یک برآورد مرتبط با نمونه گیری است. ضریب تغییرات خطای استاندارد است که به صورت درصدی از برآورد بیان می شود.
خطای نمونه گیری، نرخ پاسخ و نرخ نسبت در یک کد رتبه بندی کیفیت ترکیب می شوند. این کد از حروفی استفاده می کند که از A تا F متغیر است، که در آن A به معنی کیفیت عالی داده ها و F به معنای غیرقابل اعتماد بودن داده ها است. تخمین با کیفیت F منتشر نخواهد شد. جزئیات مربوط به این کدهای رتبه بندی کیفیت را می توان درخواست کرد و باید همیشه هنگام تجزیه و تحلیل داده ها در نظر گرفته شوند.
10-نرخ پاسخگویی:
فراداده پس از انتشار ارائه خواهد شد.
11-خطای غیر نمونه برداری:
خطاهای غیر نمونه برداری ممکن است به دلایل مختلف در طول جمع آوری و پردازش داده ها رخ دهد. به عنوان مثال، عدم پاسخگویی منبع مهمی از خطای عدم نمونه گیری است. تحت پوشش یا پوشش بیش از حد جامعه، تفاوت در تفسیر سؤالات و اشتباهات در ثبت و پردازش داده ها از دیگر نمونه های خطاهای غیر نمونه گیری است. این خطاها تا حد امکان از طریق طراحی دقیق پرسشنامه نظرسنجی و تأیید داده های نظرسنجی به حداقل می رسد.
12-سوگیری بدون پاسخ:
علاوه بر افزایش واریانس، عدم پاسخ میتواند منجر به تخمینهای جانبدارانه شود اگر افراد غیرپاسخگو دارای ویژگیهای متفاوتی با پاسخدهندگان باشند. عدم پاسخ از طریق طراحی نظرسنجی، پیگیری پاسخدهندگان، وزندهی مجدد، و تأیید و اعتبارسنجی دادههای خرد مورد بررسی قرار میگیرد.
هنگامی که عدم پاسخ رخ می دهد، در نظر گرفته می شود و کیفیت برآورد بر اساس اهمیت آن برای برآورد کاهش می یابد.