(no subject)
Dec. 13th, 2024 10:23 amМинутка жалобы на статистику.
Вчера доредактировала описание методов и материалов. 18 страниц. Многовато, но там с картинками и таблицами, так что дай, думаю, отправлю пока научрукам, как есть, потом подсокращу, если что.
И вот пишу, значит, абзац про валидность и надежность и вдруг до меня медленно-медленно доходит, что тесты на надежность я сделала два месяца назад на файлах с сырыми даннами. С тех пор я их почистила, мне пришлось сократить количество участников с 170 сначала до 150, а потом до 124. И теперь те тесты, что были сделаны с файлом из 170 человек, совершенно никакого значения не имеют, потому что если я не использую полсотни люди во всех остальных статистических анализах, то и в анализе надежности не должна использовать.
И пока это осознание медленно так опускается в мою голову, я понимаю, что когда я приводила файлы с данными в божеский вид, я сделала еще одну гигантскую ошибку. А именно: я хотела упростить себе жизнь и решила, что вместо того, чтобы оставлять в рабочем файле все ответы на каждый пункт каждого теста (4 теста по 20 вопросов, дважды, т.к. пре-тест и пост-тест), я лучше сохраню для каждого участника общее кол-во баллов за каждый тест, чтобы у меня было всего 8 колонок, а не 88, а колонки на каждый вопрос удалю.
Но без этих удаленных 80 колонок я не смогу сделать проверку надежности! А это означает, что теперь мне надо заново брать сырые файлы и заново чистить их от ненужной информации (удалять участников, которых нельзя анализировать, переводить ответы на разных языках на нидерландский, удалять колонки с нерелевантной инфой типа ай-пи адресов), но в этот раз надо будет оставить все ответы по каждому пункту каждого теста.
Обнаружила я все это вчера в 10 вечера. Ночью мне, естественно, снились эксель-таблички. Потому что я нуб и не знаю, как можно всю эту чистку данных сделать более эффективной и быстрой, я умею только вручную убирать ненужные колонки и вбивать ручками недостающие данные. И прям "предвкушаю", как буду опять это делать по которому кругу.
Я уже три раза переделывала этот долбанный файл с данными. Три раза... Именно поэтому я до сих пор так и не доделала свои статистические анализы.
Сейчас начну переделывать в четвертый, блин, раз.
Сил моих никаких нет:((
Вчера доредактировала описание методов и материалов. 18 страниц. Многовато, но там с картинками и таблицами, так что дай, думаю, отправлю пока научрукам, как есть, потом подсокращу, если что.
И вот пишу, значит, абзац про валидность и надежность и вдруг до меня медленно-медленно доходит, что тесты на надежность я сделала два месяца назад на файлах с сырыми даннами. С тех пор я их почистила, мне пришлось сократить количество участников с 170 сначала до 150, а потом до 124. И теперь те тесты, что были сделаны с файлом из 170 человек, совершенно никакого значения не имеют, потому что если я не использую полсотни люди во всех остальных статистических анализах, то и в анализе надежности не должна использовать.
И пока это осознание медленно так опускается в мою голову, я понимаю, что когда я приводила файлы с данными в божеский вид, я сделала еще одну гигантскую ошибку. А именно: я хотела упростить себе жизнь и решила, что вместо того, чтобы оставлять в рабочем файле все ответы на каждый пункт каждого теста (4 теста по 20 вопросов, дважды, т.к. пре-тест и пост-тест), я лучше сохраню для каждого участника общее кол-во баллов за каждый тест, чтобы у меня было всего 8 колонок, а не 88, а колонки на каждый вопрос удалю.
Но без этих удаленных 80 колонок я не смогу сделать проверку надежности! А это означает, что теперь мне надо заново брать сырые файлы и заново чистить их от ненужной информации (удалять участников, которых нельзя анализировать, переводить ответы на разных языках на нидерландский, удалять колонки с нерелевантной инфой типа ай-пи адресов), но в этот раз надо будет оставить все ответы по каждому пункту каждого теста.
Обнаружила я все это вчера в 10 вечера. Ночью мне, естественно, снились эксель-таблички. Потому что я нуб и не знаю, как можно всю эту чистку данных сделать более эффективной и быстрой, я умею только вручную убирать ненужные колонки и вбивать ручками недостающие данные. И прям "предвкушаю", как буду опять это делать по которому кругу.
Я уже три раза переделывала этот долбанный файл с данными. Три раза... Именно поэтому я до сих пор так и не доделала свои статистические анализы.
Сейчас начну переделывать в четвертый, блин, раз.
Сил моих никаких нет:((
no subject
Date: 2024-12-13 09:32 am (UTC)no subject
Date: 2024-12-13 09:34 am (UTC)вот промежуточные варианты я, кстати, сохраняю. Но в этой конкретной ситуации меня это не спасет, увы.
no subject
Date: 2024-12-13 10:45 am (UTC)no subject
Date: 2024-12-13 11:23 am (UTC)Все, что я стала делать лучше — это выполнять последовательность действий, которые по идее должны меня привести к какому-то результату..
очень жаль убитого на все это времени:(
no subject
Date: 2024-12-13 11:51 am (UTC)Ох как. Иди на ручки срочно!!!
no subject
Date: 2025-01-03 10:06 pm (UTC)no subject
Date: 2025-01-05 04:34 pm (UTC)Это сложно, и все-равно оно точно получится!!
no subject
Date: 2024-12-13 01:50 pm (UTC)no subject
Date: 2024-12-13 02:22 pm (UTC)блииин, как обидно
ну пусть уже в последний будет!
no subject
Date: 2024-12-13 05:37 pm (UTC)Да не то слово... У меня уже руки опускаются. В воскресенье буду созваниваться с подругой, которая Мегамозг и профессор, она обещала объяснить мне, как мне решить эту тему с надёжностью тестов, если я не делала их пилот и проверку до интервенции
no subject
Date: 2024-12-13 05:35 pm (UTC)no subject
Date: 2024-12-13 05:36 pm (UTC)Не, чат жпт не справится. Да и там личные данные, нельзя в ии такое
no subject
Date: 2024-12-13 05:39 pm (UTC)И там ещё беда в том, что те ответы, которые люди вводили на русском, сохранились в нечитаемой кодировке. То есть их ещё сначала декодировать надо..