Wnioski
- Pewne wielkości planu 5-letniego – bez kombinacji liniowych – są ze sobą silnie skorelowane, dlatego warto rozważyć ich agregację – np. przy użyciu analizy głównych składowych (PCA) – zanim przystąpi się do tworzenia przy ich użyciu modeli prognostycznych.
- Różnice
pomiędzy wartościami publikowanymi w różnych horyzontach prognozy a ostatnimi
wartościami dostępnymi przed dostawą zmieniają się systematycznie, dlatego przy
budowie modeli prognostycznych należy posługiwać się wartościami dostępnymi na
ustalony horyzont prognozy.
Co jest publikowane?
Plan 5-letni publikowany jest od 1 stycznia 2021 r. To dostatecznie długi czas – ponad 2,5 roku na dzień pisania tej publikacji – by spróbować odpowiedzieć sobie na pytania dot. np. możliwości użycia publikowanych wielkości w modelach prognostycznych na rynku energii.
Wartości planu aktualizowane są co kilka-kilkanaście minut każdej doby, aktualnie w granulacji godzinowej. Horyzont prognozy względem godziny dostawy waha się od kilku minut do kilku miesięcy. W ramach planu publikowane są wielkości zebrane w tabeli poniżej.
Tabela 1. Nazwy oryginalne i skrócone (używane dalej dla wygody) publikowanych wielkości w planie 5-letnim PSE.
Nazwa oryginalna wielkości
publikowanej w planie 5-letnim |
Nazwa skrócona |
1. Doba |
|
2. Godzina |
|
3. Prognozowane zapotrzebowanie sieci [MW] |
(03) Zapotrzebowanie sieci |
4. Wymagana rezerwa mocy OSP [MW] |
(04) Wym. rezerwa mocy |
5. Nadwyżka mocy dostępna dla OSP (7) + (10) - [(3) - (13)] - (14) [MW] * |
(05) Nadwyżka mocy |
6. Nadwyżka mocy dostępna dla OSP ponad wymaganą rezerwę mocy (5) - (4) [MW] † |
(06) Nadw. mocy ponad rez. |
7. Moc
dyspozycyjna JW i magazynów energii świadczących usługi bilansujące |
(07) Moc dyspozycyjna |
8. Moc dyspozycyjna JW i magazynów energii świadczących usługi bilansujące w ramach RB, dostępna dla OSP [MW] ‡ |
(08) Moc dysp. dla OSP |
9.
Przewidywana generacja JW i magazynów energii świadczących usługi bilansujące
|
(09) Gen. w ramach RB |
10. Prognozowana generacja JW i magazynów energii nieświadczących usług bilansujących w ramach RB [MW] |
(10) Gen. poza RB |
11. Prognozowana sumaryczna generacja źródeł wiatrowych [MW] |
(11) Gen. źródeł wiatr. |
12. Prognozowana sumaryczna generacja źródeł fotowoltaicznych [MW] |
(12) Gen. źródeł PV |
13. Planowane saldo wymiany międzysystemowej [MW] |
(13) Saldo wymiany |
14. Prognozowana wielkość niedyspozycyjności wynikająca z ograniczeń sieciowych występujących w sieci przesyłowej oraz sieci dystrybucyjnej w zakresie dostarczania energii elektrycznej [MW] |
(14) Ograniczenia sieciowe |
15. Wielkość niedyspozycyjności wynikających z warunków eksploatacyjnych zgłoszonych dla JW cieplnych świadczących usługi bilansujące w ramach rynku bilansującego [MW] † |
(15) Niedysp. JW cieplnych |
16. Przewidywana generacja zasobów wytwórczych nieobjętych obowiązkami mocowymi [MW] |
(16) Gen. źr. bez obow. moc. |
17. Obowiązki mocowe wszystkich jednostek rynku mocy [MW] |
(17) Obowiązki mocowe |
†) Wielkość publikowana od 24 kwietnia 2023 r.
‡) Wielkość publikowana od 15 lipca 2021 r.
Źródło: Opracowanie własne na podstawie: https://www.pse.pl/dane-systemowe/plany-pracy-kse/plan-koordynacyjny-5-letni/wielkosci-podstawowe/opis
Co jest z sobą powiązane?
Plan 5-letni zawiera wielkości odzwierciedlające popyt, podaż i salda występujące w Krajowym Systemie Elektroenergetycznym. Zgodnie z tym kryterium poszczególne wielkości można przedstawić schematycznie, jak na poniższym diagramie.
Rysunek 1. Diagram powiązań między publikowanymi wielkościami w planie 5-letnim PSE.
Dzięki schematowi dość szybko można zidentyfikować wielkości – (05), (06) i (09) – które są kombinacjami liniowymi innych wielkości, i które będą powodować współliniowość w przypadku budowy modelu prognostycznym.
Oprócz kombinacji liniowych w planie występują także wielkości, które są wyznaczane w oparciu o inne, tj. (04), (08) i (10), i które niosą bardzo podobną wartość informacyjną do tych wielkości, na których podstawie są budowane.
Wielkości (10) nie da się jednoznacznie sklasyfikować ściśle jako zmiennej zależnej, ponieważ obok produkcji ze źródeł wiatrowych i fotowoltaicznych zawiera ona także komponent różny od generacji z odnawialnych źródeł energii.
W przypadku występowania częściowych powiązań pomiędzy wielkościami, warto rozważyć np. eliminację jednej ze zmiennych – źródłowej lub pochodnej – w celu zapewnienia dobrej jakości modelu.
Współczynniki korelacji liniowych między wielkościami – z pominięciem wielkości będącymi kombinacjami liniowymi innych – zostały przedstawione w tabelach poniżej, osobno dla wartości godzinowych i dobowych. Współczynniki korelacji zostały obliczone w oparciu o ostatnie dostępne wartości, tj. te publikowane tuż przed dostawą.
Tabela 2. Współczynniki korelacji liniowych danych godzinowych pomiędzy wielkościami planu 5-letniego publikowanymi co najmniej od 24 kwietnia 2021 r., z pominięciem zmiennych będących kombinacjami liniowymi innych zmiennych.
Miary statystyczne
Podstawowe miary statystyczne wielkości z planu 5-letniego zilustrowane są na poniższym rysunku. Rysunek powstał na podstawie wartości publikowanych tuż przed dostawą i nie zawiera wielkości publikowanych po 24 kwietnia 2023 r. ze względu na zbyt krótki okres dostępnych danych, a także nie zawiera obowiązków mocowych przyjmujących jak dotąd jedynie 11 różnych wartości poza zerem.
Rysunek 2. Rozstępy, średnie, odchylenia standardowe i skośności wielkości publikowanych w planie 5-letnim.
Co wynika z analizy głównych składowych?
Wyniki analizy głównych składowych (ang. Principal Component Analysis – PCA) dla znormalizowanych wielkości publikowanych w planie 5-letnim przedstawione są w poniższych tabelach. Normalizacja polegała na odjęciu wartości średniej i podzieleniu tak otrzymanej różnicy przez odchylenie standardowe zaobserwowanych wartości.
Kolorem zielonym oznaczone są wartości bezwzględnie większe lub równe 30% – arbitralnie wybranej wartości progowej, przy której uznałem, że dana wielkość ma istotny wpływ na konstrukcję głównej składowej. Pierwsze wystąpienia wartości powyżej wartości progowej są otoczone ramką.
W pierwszych wierszach tabel są kolejne indeksy głównych składowych; dla nich zielone tło oznacza, ilu znormalizowanych zmiennych potrzeba, by użyć wszystkich dostępnych wielkości, których czynniki przekroczą wartość progową.
Tabela 4. Wartości głównych składowych i narastające procenty objaśnionej wariancji całkowitej dla znormalizowanych wielkości godzinowych publikowanych w planie 5-letnim.
Warto zwrócić
uwagę na łączenie się zmiennych w grupy oraz na znaki, które towarzyszą
zmiennym. Stanowią one odzwierciedlenie zdekomponowanych korelacji przedstawionych
w tabelach korelacji z poprzedniej sekcji. Można na ich podstawie budować
agregaty ściśle powiązanych ze sobą zmiennych, które mogą w decydujący sposób
wpływać na inne prognozowane wielkości.
Aby przekonać się, jakie wyniki dają kolejne kombinacje głównych składowych w porównaniu z uwzględnieniem ww. 11 zmiennych, wybrałem cenę rozliczeniową rynku bilansującego jako zmienną objaśnianą. Wyniki różnych modeli regresji względem głównych składowych PCA, wyrażone jako średnie bezwzględne błędy procentowe (ang. Mean Absolute Percentage Error – MAPE), są przedstawione jako różnice względem modelu regresji względem wszystkich nieznormalizowanych zmiennych. Oczywiście, dla 11 głównych składowych różnice pomiędzy MAPE są równe zero, gdyż są to matematycznie tożsame modele regresji względem zmiennych znormalizowanych i nieznormalizowanych.
Rysunek 3. Różnice MAPE dla prognoz godzinowych (górny wykres) i dobowych (dolny wykres) dla cen rynku bilansującego pomiędzy regresją PCA względem zadanej liczby głównych składowych (od 1 do 11) powstałych na podstawie znormalizowanych wielkości podanych w tabeli 4 i 5, a regresją względem wszystkich 11 zmiennych podanych w tabeli 2 i 3. Okres uczenia (kalibracji) modelu to 2021-07-15 – 2022-12-31 i jest rozłączny z okresem walidacji 2023-01-01 – 2023-07-31.
Co się dzieje im bliżej dostawy?
Inną interesującą własnością wielkości planu 5-letniego jest to, że wykazują one systematyczne prawidłowości, jeśli chodzi o zmiany publikowanych wartości w miarę zbliżania się do godziny dostawy.
Na kolejnych wykresach znajdują się średnie i odchylenia standardowe bezwzględnych różnic dla różnych wielkości (niebieska linia i symetryczne „wąsy”). Horyzonty dostawy zostały pogrupowane w osiem arbitralnie wybranych zakresów, tzn.:
- powyżej pół roku (> 6m),
- pomiędzy jednym a sześcioma miesiącami (1-6 m),
- pomiędzy dziesięcioma a trzydziestoma dniami (10-30 d),
- pomiędzy jednym a dziesięcioma dniami (1-10 d),
- pomiędzy dwunastoma a dwudziestoma czteroma godzinami (12-24 h),
- pomiędzy trzema a dwunastoma godzinami (3-12 h),
- pomiędzy godziną a trzema godzinami (1-3 h),
- poniżej jednej godziny (< 1 h).
Rysunek 4. Wykresy średnich i odchyleń standardowych różnic pomiędzy wartościami publikowanymi w różnych horyzontach prognozy planu 5-letniego a ostatnią wartością opublikowaną przed dostawą dla różnych wielkości planu 5-letniego – niebieskie linie (lewe osie). Liczby obserwacji, na których podstawie wyznaczono średnie i odchylenia standardowe, zaznaczono liniami kropkowanymi (prawe osie).
Interesujące jest to, że idąc od lewej strony niektóre wykresy zbiegają do zera od góry, inne zaś od dołu. Jest to zapewne związane z ostrożnościowym podejściem do planowania, tj. im dłuższy horyzont prognozy, tym wyższe są wartości dla wielkości związanych z zaspokojeniem oczekiwanego popytu – (03), (04), (05), (07), (08) i (09) – oraz tym niższe wartości dla wielkości związanych ze spodziewaną podażą, na którą operator sieci nie ma bezpośredniego wpływu – (10), (11), (12) i (16). Są także wielkości, które zachowują się stabilnie – (13) i (14), tj. najprawdopodobniej w ich przypadku zakłada się, że będą one bliskie zakładanej wartości (najczęściej zeru).
Jeśli więc kalibracja modelu prognostycznego odbywałaby się na danych ostatnio dostępnych, tj. tych tuż przed dostawą, a nie na danych, które faktycznie można zaobserwować w horyzoncie, na jaki tworzona jest prognoza, to pewne wielkości będą zawsze średnio przeszacowane, inne zawsze średnio niedoszacowane, co wpłynie na pogorszenie jakości prognozy.
Warto też dodać, że pewna
prawidłowość związana z różnicami przed dostawą występuje także w zależności od
godziny doby dostawy. Przykładowo, dla wielkości „(03) Zapotrzebowanie sieci”
dla godzin od 10 do 18 następuje większe przeszacowanie dla dłuższych
horyzontów prognozy. Jest to prawdopodobnie związane z wyższym zapotrzebowaniem
w ciągu godzin szczytowych. Odchylenie standardowe również jest dla nich wyższe,
co jest pochodną większej niestabilności zapotrzebowania na moc w godzinach
szczytu.
Brak komentarzy:
Prześlij komentarz