Navigation Panel

Plan 5-letni bez tajemnic


Wnioski

  1. Pewne wielkości planu 5-letniego – bez kombinacji liniowych – są ze sobą silnie skorelowane, dlatego warto rozważyć ich agregację – np. przy użyciu analizy głównych składowych (PCA) – zanim przystąpi się do tworzenia przy ich użyciu modeli prognostycznych.
  2. Różnice pomiędzy wartościami publikowanymi w różnych horyzontach prognozy a ostatnimi wartościami dostępnymi przed dostawą zmieniają się systematycznie, dlatego przy budowie modeli prognostycznych należy posługiwać się wartościami dostępnymi na ustalony horyzont prognozy.

Co jest publikowane?

Plan 5-letni publikowany jest od 1 stycznia 2021 r. To dostatecznie długi czas – ponad 2,5 roku na dzień pisania tej publikacji – by spróbować odpowiedzieć sobie na pytania dot. np. możliwości użycia publikowanych wielkości w modelach prognostycznych na rynku energii.

Wartości planu aktualizowane są co kilka-kilkanaście minut każdej doby, aktualnie w granulacji godzinowej. Horyzont prognozy względem godziny dostawy waha się od kilku minut do kilku miesięcy. W ramach planu publikowane są wielkości zebrane w tabeli poniżej.

Tabela 1. Nazwy oryginalne i skrócone (używane dalej dla wygody) publikowanych wielkości w planie 5-letnim PSE.

Nazwa oryginalna wielkości publikowanej w planie 5-letnim
poprzedzona numerem kolumny

Nazwa skrócona
(używana dalej dla wygody)

1. Doba

 

2. Godzina

 

3. Prognozowane zapotrzebowanie sieci [MW]

(03) Zapotrzebowanie sieci

4. Wymagana rezerwa mocy OSP [MW]

(04) Wym. rezerwa mocy

5. Nadwyżka mocy dostępna dla OSP (7) + (10) - [(3) - (13)] - (14) [MW] *

(05) Nadwyżka mocy

6. Nadwyżka mocy dostępna dla OSP ponad wymaganą rezerwę mocy (5) - (4) [MW]

(06) Nadw. mocy ponad rez.

7. Moc dyspozycyjna JW i magazynów energii świadczących usługi bilansujące
w ramach RB [MW]

(07) Moc dyspozycyjna

8. Moc dyspozycyjna JW i magazynów energii świadczących usługi bilansujące w ramach RB, dostępna dla OSP [MW]

(08) Moc dysp. dla OSP

9. Przewidywana generacja JW i magazynów energii świadczących usługi bilansujące
w ramach RB (3) - (10) - (13) [MW] *

(09) Gen. w ramach RB

10. Prognozowana generacja JW i magazynów energii nieświadczących usług bilansujących w ramach RB [MW]

(10) Gen. poza RB

11. Prognozowana sumaryczna generacja źródeł wiatrowych [MW]

(11) Gen. źródeł wiatr.

12. Prognozowana sumaryczna generacja źródeł fotowoltaicznych [MW]

(12) Gen. źródeł PV

13. Planowane saldo wymiany międzysystemowej [MW]

(13) Saldo wymiany

14. Prognozowana wielkość niedyspozycyjności wynikająca z ograniczeń sieciowych występujących w sieci przesyłowej oraz sieci dystrybucyjnej w zakresie dostarczania energii elektrycznej [MW]

(14) Ograniczenia sieciowe

15. Wielkość niedyspozycyjności wynikających z warunków eksploatacyjnych zgłoszonych dla JW cieplnych świadczących usługi bilansujące w ramach rynku bilansującego [MW]

(15) Niedysp. JW cieplnych

16. Przewidywana generacja zasobów wytwórczych nieobjętych obowiązkami mocowymi [MW]

(16) Gen. źr. bez obow. moc.

17. Obowiązki mocowe wszystkich jednostek rynku mocy [MW]

(17) Obowiązki mocowe

*) Nazwa zaktualizowana, odzwierciedlająca aktualną numerację publikowanych wielkości.
) Wielkość publikowana od 24 kwietnia 2023 r.
‡) Wielkość publikowana od 15 lipca 2021 r.

Źródło: Opracowanie własne na podstawie: https://www.pse.pl/dane-systemowe/plany-pracy-kse/plan-koordynacyjny-5-letni/wielkosci-podstawowe/opis 

Co jest z sobą powiązane?

Plan 5-letni zawiera wielkości odzwierciedlające popyt, podaż i salda występujące w Krajowym Systemie Elektroenergetycznym. Zgodnie z tym kryterium poszczególne wielkości można przedstawić schematycznie, jak na poniższym diagramie.

Rysunek 1. Diagram powiązań między publikowanymi wielkościami w planie 5-letnim PSE.



Dzięki schematowi dość szybko można zidentyfikować wielkości – (05), (06) i (09) – które są kombinacjami liniowymi innych wielkości, i które będą powodować współliniowość w przypadku budowy modelu prognostycznym.

Oprócz kombinacji liniowych w planie występują także wielkości, które są wyznaczane w oparciu o inne, tj. (04), (08) i (10), i które niosą bardzo podobną wartość informacyjną do tych wielkości, na których podstawie są budowane.

Wielkości (10) nie da się jednoznacznie sklasyfikować ściśle jako zmiennej zależnej, ponieważ obok produkcji ze źródeł wiatrowych i fotowoltaicznych zawiera ona także komponent różny od generacji z odnawialnych źródeł energii.

W przypadku występowania częściowych powiązań pomiędzy wielkościami, warto rozważyć np. eliminację jednej ze zmiennych – źródłowej lub pochodnej – w celu zapewnienia dobrej jakości modelu.

Współczynniki korelacji liniowych między wielkościami – z pominięciem wielkości będącymi kombinacjami liniowymi innych – zostały przedstawione w tabelach poniżej, osobno dla wartości godzinowych i dobowych. Współczynniki korelacji zostały obliczone w oparciu o ostatnie dostępne wartości, tj. te publikowane tuż przed dostawą.

Tabela 2. Współczynniki korelacji liniowych danych godzinowych pomiędzy wielkościami planu 5-letniego publikowanymi co najmniej od 24 kwietnia 2021 r., z pominięciem zmiennych będących kombinacjami liniowymi innych zmiennych.


Tabela 3. Współczynniki korelacji liniowych danych dobowych (uśrednionych godzinowych) pomiędzy wielkościami planu 5-letniego publikowanymi co najmniej od 24 kwietnia 2021 r., z pominięciem zmiennych będących kombinacjami liniowymi innych zmiennych.

Miary statystyczne

Podstawowe miary statystyczne wielkości z planu 5-letniego zilustrowane są na poniższym rysunku. Rysunek powstał na podstawie wartości publikowanych tuż przed dostawą i nie zawiera wielkości publikowanych po 24 kwietnia 2023 r. ze względu na zbyt krótki okres dostępnych danych, a także nie zawiera obowiązków mocowych przyjmujących jak dotąd jedynie 11 różnych wartości poza zerem.

Rysunek 2. Rozstępy, średnie, odchylenia standardowe i skośności wielkości publikowanych w planie 5-letnim.




Co wynika z analizy głównych składowych?

Wyniki analizy głównych składowych (ang. Principal Component Analysis – PCA) dla znormalizowanych wielkości publikowanych w planie 5-letnim przedstawione są w poniższych tabelach. Normalizacja polegała na odjęciu wartości średniej i podzieleniu tak otrzymanej różnicy przez odchylenie standardowe zaobserwowanych wartości.

Kolorem zielonym oznaczone są wartości bezwzględnie większe lub równe 30% – arbitralnie wybranej wartości progowej, przy której uznałem, że dana wielkość ma istotny wpływ na konstrukcję głównej składowej. Pierwsze wystąpienia wartości powyżej wartości progowej są otoczone ramką.

W pierwszych wierszach tabel są kolejne indeksy głównych składowych; dla nich zielone tło oznacza, ilu znormalizowanych zmiennych potrzeba, by użyć wszystkich dostępnych wielkości, których czynniki przekroczą wartość progową.

Tabela 4. Wartości głównych składowych i narastające procenty objaśnionej wariancji całkowitej dla znormalizowanych wielkości godzinowych publikowanych w planie 5-letnim.


Tabela 5. Wartości głównych składowych i narastające procenty objaśnionej wariancji całkowitej dla znormalizowanych wielkości dobowych publikowanych w planie 5-letnim.


Ostatnie wiersze tabel przedstawiają skumulowane procenty całkowitej wariancji objaśnianej przez dany zestaw głównych składowych. Już 4 składowe wystarczą, by wyjaśnić ponad 80% całkowitej zmienności występującej we wszystkich 11 badanych zmiennych.

Warto zwrócić uwagę na łączenie się zmiennych w grupy oraz na znaki, które towarzyszą zmiennym. Stanowią one odzwierciedlenie zdekomponowanych korelacji przedstawionych w tabelach korelacji z poprzedniej sekcji. Można na ich podstawie budować agregaty ściśle powiązanych ze sobą zmiennych, które mogą w decydujący sposób wpływać na inne prognozowane wielkości.

Aby przekonać się, jakie wyniki dają kolejne kombinacje głównych składowych w porównaniu z uwzględnieniem ww. 11 zmiennych, wybrałem cenę rozliczeniową rynku bilansującego jako zmienną objaśnianą. Wyniki różnych modeli regresji względem głównych składowych PCA, wyrażone jako średnie bezwzględne błędy procentowe (ang. Mean Absolute Percentage Error – MAPE), są przedstawione jako różnice względem modelu regresji względem wszystkich nieznormalizowanych zmiennych. Oczywiście, dla 11 głównych składowych różnice pomiędzy MAPE są równe zero, gdyż są to matematycznie tożsame modele regresji względem zmiennych znormalizowanych i nieznormalizowanych.

Rysunek 3. Różnice MAPE dla prognoz godzinowych (górny wykres) i dobowych (dolny wykres) dla cen rynku bilansującego pomiędzy regresją PCA względem zadanej liczby głównych składowych (od 1 do 11) powstałych na podstawie znormalizowanych wielkości podanych w tabeli 4 i 5, a regresją względem wszystkich 11 zmiennych podanych w tabeli 2 i 3. Okres uczenia (kalibracji) modelu to 2021-07-15 – 2022-12-31 i jest rozłączny z okresem walidacji 2023-01-01 – 2023-07-31.



Interesujące, że najlepsze efekty – mierzone za pomocą miary MAPE – ma w obu przypadkach model z tylko jedną główną składową PCA. Miara MAPE dla prognoz cen rynku bilansującego otrzymanych przy użyciu tylko tej jednej składowej jest mniejsza odpowiednio o 7% (prognozy godzinowe) i o 10% (prognozy dobowe) od prognoz otrzymanych przy użyciu regresji względem wszystkich zmiennych. Dla prognoz godzinowych znacząco lepsze rezultaty (tj. o co najmniej 2%) mają jeszcze modele z trzema i czterema składowymi PCA. Najgorsze efekty występują przy ok. 5-8 składowych PCA.

Co się dzieje im bliżej dostawy?

Inną interesującą własnością wielkości planu 5-letniego jest to, że wykazują one systematyczne prawidłowości, jeśli chodzi o zmiany publikowanych wartości w miarę zbliżania się do godziny dostawy.

Na kolejnych wykresach znajdują się średnie i odchylenia standardowe bezwzględnych różnic dla różnych wielkości (niebieska linia i symetryczne „wąsy”). Horyzonty dostawy zostały pogrupowane w osiem arbitralnie wybranych zakresów, tzn.:

  • powyżej pół roku (> 6m),
  • pomiędzy jednym a sześcioma miesiącami (1-6 m),
  • pomiędzy dziesięcioma a trzydziestoma dniami (10-30 d),
  • pomiędzy jednym a dziesięcioma dniami (1-10 d),
  • pomiędzy dwunastoma a dwudziestoma czteroma godzinami (12-24 h),
  • pomiędzy trzema a dwunastoma godzinami (3-12 h),
  • pomiędzy godziną a trzema godzinami (1-3 h),
  • poniżej jednej godziny (< 1 h).
Dla każdego z ww. zakresów podano liczbę obserwacji, na których podstawie wyznaczono średnie i odchylenia standardowe. Liczby obserwacji są zaznaczone liniami kropkowanymi.

Rysunek 4. Wykresy średnich i odchyleń standardowych różnic pomiędzy wartościami publikowanymi w różnych horyzontach prognozy planu 5-letniego a ostatnią wartością opublikowaną przed dostawą dla różnych wielkości planu 5-letniego – niebieskie linie (lewe osie). Liczby obserwacji, na których podstawie wyznaczono średnie i odchylenia standardowe, zaznaczono liniami kropkowanymi (prawe osie).


Interesujące jest to, że idąc od lewej strony niektóre wykresy zbiegają do zera od góry, inne zaś od dołu. Jest to zapewne związane z ostrożnościowym podejściem do planowania, tj. im dłuższy horyzont prognozy, tym wyższe są wartości dla wielkości związanych z zaspokojeniem oczekiwanego popytu – (03), (04), (05), (07), (08) i (09) – oraz tym niższe wartości dla wielkości związanych ze spodziewaną podażą, na którą operator sieci nie ma bezpośredniego wpływu – (10), (11), (12) i (16). Są także wielkości, które zachowują się stabilnie – (13) i (14), tj. najprawdopodobniej w ich przypadku zakłada się, że będą one bliskie zakładanej wartości (najczęściej zeru).

Jeśli więc kalibracja modelu prognostycznego odbywałaby się na danych ostatnio dostępnych, tj. tych tuż przed dostawą, a nie na danych, które faktycznie można zaobserwować w horyzoncie, na jaki tworzona jest prognoza, to pewne wielkości będą zawsze średnio przeszacowane, inne zawsze średnio niedoszacowane, co wpłynie na pogorszenie jakości prognozy.

Warto też dodać, że pewna prawidłowość związana z różnicami przed dostawą występuje także w zależności od godziny doby dostawy. Przykładowo, dla wielkości „(03) Zapotrzebowanie sieci” dla godzin od 10 do 18 następuje większe przeszacowanie dla dłuższych horyzontów prognozy. Jest to prawdopodobnie związane z wyższym zapotrzebowaniem w ciągu godzin szczytowych. Odchylenie standardowe również jest dla nich wyższe, co jest pochodną większej niestabilności zapotrzebowania na moc w godzinach szczytu.

Rysunek 5. Wykresy średnich i odchyleń standardowych różnic pomiędzy wartościami publikowanymi w różnych horyzontach prognozy planu 5-letniego a ostatnią wartością dostępną przed godziną dostawy dla kolejnych godzin doby.


Brak komentarzy:

Prześlij komentarz